Apa yang Harus Dipantau

Edge for Private Cloud v4.18.01

Umumnya dalam penyiapan produksi, perlu mengaktifkan mekanisme pemantauan dalam deployment Apigee Edge untuk Private Cloud. Teknik pemantauan ini memperingatkan administrator (atau operator) jaringan tentang error atau kegagalan. Setiap error yang dihasilkan dilaporkan sebagai pemberitahuan di Apigee Edge. Untuk mengetahui informasi selengkapnya tentang pemberitahuan, lihat Praktik Terbaik Pemantauan.

Untuk memudahkan, komponen Apigee diklasifikasikan terutama ke dalam dua kategori:

  • Layanan Server Java khusus Apigee – Ini mencakup Server Pengelolaan, Pemroses Pesan, Server Qpid, dan Server Postgres.
  • Layanan Pihak Ketiga – Ini mencakup Router Nginx, Apache Cassandra, Apache ZooKeeper, OpenLDAP, database PostgreSQL, dan Qpid.

Dalam deployment Apigee Edge di lokasi, tabel berikut memberikan ringkasan cepat tentang parameter yang dapat Anda pantau:

Komponen

Pemeriksaan Sistem

Statistik Tingkat Proses

Pemeriksaan Tingkat API

Pemeriksaan Alur Pesan

Khusus Komponen

Layanan Java khusus Apigee

Server Pengelolaan

?

?

?

Message Processor

?

?

?

?

Server Qpid

?

?

?

Server Postgres

?

?

?

Layanan Pihak Ketiga

Apache Cassandra

?

?

Apache ZooKeeper

?

?

OpenLDAP

?

?

Database PostgreSQL

?

?

Qpid

?

?

Router Nginx

?

?

?

Secara umum, setelah Apigee Edge diinstal, Anda dapat melakukan tugas pemantauan berikut untuk melacak performa penginstalan Apigee Edge untuk Private Cloud.

Pemeriksaan kesehatan sistem

Sangat penting untuk mengukur parameter kesehatan sistem seperti penggunaan CPU, penggunaan memori, dan konektivitas port di tingkat yang lebih tinggi. Anda dapat memantau parameter berikut untuk mendapatkan dasar-dasar kondisi sistem.

  • CPU Utilization – Menentukan statistik dasar (User/System/IO Wait/Idle) tentang penggunaan CPU. Misalnya, total CPU yang digunakan oleh sistem.
  • Free/Used Memory – Menentukan penggunaan memori sistem sebagai byte. Misalnya, memori fisik yang digunakan oleh sistem.
  • Penggunaan Ruang Disk – Menentukan informasi sistem file berdasarkan penggunaan disk saat ini. Misalnya, ruang hard disk yang digunakan oleh sistem.
  • Load Average – Menentukan jumlah proses yang menunggu untuk dijalankan.
  • Statistik Jaringan – Paket dan/atau byte jaringan yang dikirim dan diterima, beserta error transmisi tentang komponen yang ditentukan.

Pemeriksaan Proses/Aplikasi

Di tingkat proses, Anda dapat melihat informasi penting tentang semua proses yang berjalan. Misalnya, ini mencakup statistik penggunaan memori dan CPU yang digunakan oleh proses atau aplikasi. Untuk proses seperti qpidd, postmaster postgres, java, dan sebagainya, Anda dapat memantau hal berikut:

  • Identifikasi proses: Mengidentifikasi proses Apigee tertentu. Misalnya, Anda dapat memantau keberadaan proses java server Apigee.
  • Statistik thread: Melihat pola threading yang mendasari yang digunakan proses. Misalnya, Anda dapat memantau jumlah thread puncak, jumlah thread untuk semua proses.
  • Penggunaan memori: Melihat penggunaan memori untuk semua proses Apigee. Misalnya, Anda dapat memantau parameter seperti penggunaan memori heap, penggunaan memori non-heap yang digunakan oleh proses.

Pemeriksaan tingkat API

Di tingkat API, Anda dapat memantau apakah server aktif dan berjalan untuk panggilan API yang sering digunakan yang di-proxy oleh Apigee. Misalnya, Anda dapat melakukan pemeriksaan API pada Server Pengelolaan, Router, dan Pemroses Pesan dengan memanggil perintah cURL berikut:

curl http://<host>:<port>/v1/servers/self/up

Dengan <host> adalah alamat IP komponen Apigee Edge. Nomor <port> bersifat khusus untuk setiap komponen Edge. Contoh:

Server Pengelolaan: 8080

  • Router: 8081
  • Message Processor: 8082
  • dll.

Lihat setiap bagian di bawah untuk mengetahui informasi tentang cara menjalankan perintah ini untuk setiap komponen

Panggilan ini menampilkan "true" dan "false". Untuk hasil terbaik, Anda juga dapat melakukan panggilan API langsung di backend (yang berinteraksi dengan software Apigee) untuk menentukan dengan cepat apakah ada error dalam lingkungan software Apigee atau di backend.

Catatan: Untuk memantau proxy API, Anda juga dapat menggunakan API Health Apigee. API Health melakukan panggilan terjadwal ke proxy API Anda dan memberi tahu Anda saat gagal dan caranya. Saat panggilan berhasil, API Health akan menampilkan waktu respons dan bahkan dapat memberi tahu Anda saat latensi respons tinggi. API Kesehatan dapat melakukan panggilan dari berbagai lokasi di seluruh dunia untuk membandingkan perilaku API di antara region.

Pemeriksaan alur pesan

Anda dapat mengumpulkan data dari Router dan Message Processor tentang pola/statistik alur pesan. Hal ini memungkinkan Anda memantau hal berikut:

  • Jumlah klien aktif
  • Jumlah respons (10X, 20X, 30X, 40X, dan 50X)
  • Kegagalan koneksi

Hal ini membantu Anda menyediakan dasbor untuk alur pesan API. Untuk mengetahui informasi selengkapnya, lihat:

Health check router Message Processor

Router menerapkan mekanisme health check untuk menentukan Pemroses Pesan mana yang berfungsi seperti yang diharapkan. Jika Pemroses Pesan terdeteksi tidak aktif atau lambat, Router dapat otomatis mengeluarkan Pemroses Pesan dari rotasi. Jika hal itu terjadi, Router akan menulis pesan "Mark Down" ke file log Router di /opt/apigee/var/log/edge-router/logs/system.log.

Anda dapat memantau file log Router untuk melihat pesan ini. Misalnya, jika Router mengeluarkan Message Processor dari rotasi, Router akan menulis pesan ke log dalam bentuk:

2014-05-06 15:51:52,159 org: env: RPCClientClientProtocolChildGroup-RPC-0 INFO CLUSTER - ServerState.setState() : State of 2a8a0e0c-3619-416f-b037-8a42e7ad4577 is now DISCONNECTED. handle = <MP_IP> at 1399409512159

2014-04-17 12:54:48,512 org: env: nioEventLoopGroup-2-2 INFO HEARTBEAT - HBTracker.gotResponse() : No HeartBeat detected from /<MP_IP>:<PORT> Mark Down

dengan /<MP_IP>:<PORT> adalah alamat IP dan nomor port Message Processor.

Jika nanti Router melakukan pemeriksaan kondisi dan menentukan bahwa Message Processor berfungsi dengan baik, Router akan otomatis memasukkan Message Processor kembali ke rotasi. Router juga menulis pesan "Mark Up" ke log dalam bentuk:

2014-05-06 16:07:29,054 org: env: RPCClientClientProtocolChildGroup-RPC-0 INFO CLUSTER - ServerState.setState() : State of 2a8a0e0c-3619-416f-b037-8a42e7ad4577 is now CONNECTED. handle = <IP> at 1399410449054

2014-04-17 12:55:06,064 org: env: nioEventLoopGroup-4-1 INFO HEARTBEAT - HBTracker.updateHB() : HeartBeat detected from /<IP>:<PORT> Mark Up