Edge for Private Cloud نسخه 4.17.01
به طور کلی در یک راهاندازی تولید، نیاز به فعال کردن مکانیسمهای نظارت در یک Apigee Edge برای استقرار Private Cloud وجود دارد. این تکنیک های نظارت به مدیران شبکه (یا اپراتورها) در مورد خطا یا شکست هشدار می دهد. هر خطای ایجاد شده به عنوان یک هشدار در Apigee Edge گزارش می شود. برای کسب اطلاعات بیشتر در مورد هشدارها، به بهترین روشهای نظارت مراجعه کنید.
برای سهولت، اجزای Apigee عمدتا به دو دسته طبقه بندی می شوند:
- خدمات سرور جاوا مخصوص Apigee – این خدمات شامل مدیریت سرور، پردازشگر پیام، سرور Qpid و سرور Postgres است.
- خدمات شخص ثالث – این خدمات عبارتند از Nginx Router، Apache Cassandra، Apache ZooKeeper، OpenLDAP، پایگاه داده PostgreSQL و Qpid.
در یک استقرار در محل Apigee Edge، جدول زیر نگاهی گذرا به پارامترهایی که میتوانید نظارت کنید ارائه میکند:
جزء | چک های سیستم | آمار در سطح فرآیند | بررسی های سطح API | بررسی جریان پیام | کامپوننت خاص | |
---|---|---|---|---|---|---|
خدمات جاوا مخصوص Apigee | سرور مدیریت | ? | ? | ? | ||
پردازشگر پیام | ? | ? | ? | ? | ||
سرور Qpid | ? | ? | ? | |||
سرور Postgres | ? | ? | ? | |||
خدمات شخص ثالث | آپاچی کاساندرا | ? | ? | |||
Apache ZooKeeper | ? | ? | ||||
OpenLDAP | ? | ? | ||||
پایگاه داده PostgreSQL | ? | ? | ||||
Qpid | ? | ? | ||||
روتر Nginx | ? | ? | ? |
به طور کلی، پس از نصب Apigee Edge، میتوانید وظایف نظارتی زیر را برای ردیابی عملکرد Apigee Edge برای نصب ابر خصوصی انجام دهید.
بررسی سلامت سیستم
اندازه گیری پارامترهای سلامت سیستم مانند استفاده از CPU، استفاده از حافظه و اتصال پورت در سطح بالاتر بسیار مهم است. برای دریافت اصول اولیه سلامت سیستم می توانید پارامترهای زیر را کنترل کنید.
- استفاده از CPU – آمار اولیه (کاربر/سیستم/IO Wait/Idle) را در مورد استفاده از CPU مشخص می کند. به عنوان مثال، کل CPU استفاده شده توسط سیستم.
- حافظه آزاد/استفاده شده – میزان استفاده از حافظه سیستم را به صورت بایت مشخص می کند. به عنوان مثال، حافظه فیزیکی مورد استفاده توسط سیستم.
- استفاده از فضای دیسک - اطلاعات سیستم فایل را بر اساس میزان مصرف فعلی دیسک مشخص می کند. به عنوان مثال فضای هارد دیسک مورد استفاده سیستم.
- میانگین بار - تعداد فرآیندهایی که منتظر اجرا هستند را مشخص می کند.
- آمار شبکه - بسته های شبکه و/یا بایت های ارسال و دریافت شده، همراه با خطاهای انتقال در مورد یک جزء مشخص.
فرآیندها/بررسی برنامه ها
در سطح فرآیند، می توانید اطلاعات مهم در مورد تمام فرآیندهایی که در حال اجرا هستند را مشاهده کنید. به عنوان مثال، اینها شامل آمار مصرف حافظه و CPU است که یک فرآیند یا برنامه از آن استفاده می کند. برای فرآیندهایی مانند qpidd، postgres postmaster، java و غیره، می توانید موارد زیر را نظارت کنید:
- شناسایی فرآیند : یک فرآیند Apigee خاص را شناسایی کنید. به عنوان مثال، شما می توانید برای وجود فرآیند جاوا سرور Apigee نظارت کنید.
- آمار رشته : الگوهای رشتهبندی زیرینی را که یک فرآیند استفاده میکند، مشاهده کنید. به عنوان مثال، شما می توانید پیک تعداد رشته ها، تعداد رشته ها را برای همه فرآیندها نظارت کنید.
- استفاده از حافظه : میزان استفاده از حافظه را برای تمام فرآیندهای Apigee مشاهده کنید. به عنوان مثال، می توانید پارامترهایی مانند استفاده از حافظه پشته، استفاده از حافظه غیرهپ که توسط یک فرآیند استفاده می شود را نظارت کنید.
بررسی های سطح API
در سطح API، میتوانید نظارت کنید که آیا سرور برای تماسهای پرکاربرد API که توسط Apigee پراکسی میشوند، آماده و اجرا میشود. به عنوان مثال، می توانید با فراخوانی دستور cURL زیر، API را روی سرور مدیریت، روتر و پردازشگر پیام انجام دهید:
curl http://<host>:<port>/v1/servers/self/up
جایی که <host> آدرس IP جزء Apigee Edge است. شماره <port> برای هر جزء Edge خاص است. به عنوان مثال:
سرور مدیریت: 8080
- روتر: 8081
- پردازشگر پیام: 8082
- و غیره
برای اطلاعات در مورد اجرای این دستور برای هر مؤلفه به بخش های جداگانه زیر مراجعه کنید
این فراخوان "درست" و "نادرست" را برمی گرداند. برای بهترین نتایج، میتوانید تماسهای API را مستقیماً در بکاند (که نرمافزار Apigee با آن تعامل دارد) صادر کنید تا به سرعت تشخیص دهید که آیا خطا در محیط نرمافزار Apigee یا در باطن وجود دارد یا خیر.
توجه: برای نظارت بر پروکسی های API خود، می توانید از API Health Apigee نیز استفاده کنید. API Health تماسهای برنامهریزیشدهای را با پراکسیهای API شما برقرار میکند و به شما اطلاع میدهد که چه موقع و چگونه آنها شکست بخورند. وقتی تماسها با موفقیت انجام میشوند، API Health زمانهای پاسخ را به شما نشان میدهد و حتی میتواند زمانی که تأخیر پاسخ بالا است به شما اطلاع دهد. API Health میتواند از مکانهای مختلف در سراسر جهان تماس بگیرد تا رفتار API را بین مناطق مقایسه کند.
بررسی جریان پیام
شما می توانید داده هایی را از مسیریاب ها و پردازشگرهای پیام در مورد الگوی/آمار جریان پیام جمع آوری کنید. این به شما امکان می دهد موارد زیر را نظارت کنید:
- تعداد مشتریان فعال
- تعداد پاسخ ها (10X، 20X، 30X، 40X و 50X)
- اتصال خرابی ها
این به شما کمک می کند تا داشبوردهایی را برای جریان پیام API تهیه کنید.
بررسی سلامت روتر پردازشگر پیام
روتر یک مکانیسم بررسی سلامت را برای تعیین اینکه کدام یک از پردازشگرهای پیام همانطور که انتظار می رود کار می کنند پیاده سازی می کند. اگر پردازشگر پیام ضعیف یا کند تشخیص داده شود، روتر می تواند به طور خودکار پردازشگر پیام را از چرخش خارج کند. اگر این اتفاق بیفتد، روتر پیامهای "Mark Down" را در فایل گزارش روتر در /opt/apigee/var/log/edge-router/logs/system.log مینویسد.
شما می توانید فایل گزارش روتر را برای این پیام ها نظارت کنید. به عنوان مثال، اگر روتر یک پردازشگر پیام را از چرخش خارج کند، پیامی را در گزارش به شکل زیر می نویسد:
2014-05-06 15:51:52,159 org: env: RPCClientClientProtocolChildGroup-RPC-0 INFO CLUSTER - ServerState.setState() : State of 2a8a0e0c-3619-416f-b037-8a42e7ad4577 is now DISCONNECTED. handle = <MP_IP> at 1399409512159 2014-04-17 12:54:48,512 org: env: nioEventLoopGroup-2-2 INFO HEARTBEAT - HBTracker.gotResponse() : No HeartBeat detected from /<MP_IP>:<PORT> Mark Down
که در آن /<MP_IP>:<PORT> آدرس IP و شماره پورت پردازشگر پیام است.
اگر بعداً روتر یک بررسی سلامتی انجام دهد و تشخیص دهد که پردازشگر پیام به درستی کار می کند، روتر به طور خودکار پردازشگر پیام را دوباره به چرخش در می آورد. روتر همچنین یک پیام "Mark Up" را به گزارش به شکل زیر می نویسد:
2014-05-06 16:07:29,054 org: env: RPCClientClientProtocolChildGroup-RPC-0 INFO CLUSTER - ServerState.setState() : State of 2a8a0e0c-3619-416f-b037-8a42e7ad4577 is now CONNECTED. handle = <IP> at 1399410449054 2014-04-17 12:55:06,064 org: env: nioEventLoopGroup-4-1 INFO HEARTBEAT - HBTracker.updateHB() : HeartBeat detected from /<IP>:<PORT> Mark Up