สิ่งที่ควรตรวจสอบ

Edge for Private Cloud v4.18.01

โดยทั่วไปในการตั้งค่าเวอร์ชันที่ใช้งานจริง คุณจะต้องเปิดใช้กลไกการตรวจสอบภายในการติดตั้งใช้งาน Apigee Edge สำหรับระบบคลาวด์ส่วนตัว เทคนิคการตรวจสอบเหล่านี้จะเตือนผู้ดูแลระบบเครือข่าย (หรือผู้ให้บริการ) เกี่ยวกับข้อผิดพลาดหรือความล้มเหลว ระบบจะรายงานข้อผิดพลาดทั้งหมดที่เกิดขึ้นเป็นการแจ้งเตือนใน Apigee Edge ดูข้อมูลเพิ่มเติมเกี่ยวกับการแจ้งเตือนได้ที่แนวทางปฏิบัติแนะนำในการตรวจสอบ

คอมโพเนนต์ Apigee แบ่งออกเป็น 2 หมวดหมู่หลักเพื่อความสะดวก

  • บริการเซิร์ฟเวอร์ Java สำหรับ Apigee โดยเฉพาะ ซึ่งรวมถึงเซิร์ฟเวอร์การจัดการ เครื่องประมวลผลข้อความ เซิร์ฟเวอร์ Qpid และเซิร์ฟเวอร์ Postgres
  • บริการของบุคคลที่สาม ได้แก่ Nginx Router, Apache Cassandra, Apache ZooKeeper, OpenLDAP, ฐานข้อมูล PostgreSQL และ Qpid

ในการติดตั้งใช้งาน Apigee Edge บนระบบภายใน ตารางต่อไปนี้แสดงภาพรวมสั้นๆ เกี่ยวกับพารามิเตอร์ที่คุณตรวจสอบได้

คอมโพเนนต์

การตรวจสอบระบบ

สถิติระดับกระบวนการ

การตรวจสอบระดับ API

การตรวจสอบโฟลว์ข้อความ

เฉพาะคอมโพเนนต์

บริการ Java สำหรับ Apigee โดยเฉพาะ

เซิร์ฟเวอร์การจัดการ

?

?

?

Message Processor

?

?

?

?

เซิร์ฟเวอร์ Qpid

?

?

?

เซิร์ฟเวอร์ Postgres

?

?

?

บริการของบุคคลที่สาม

Apache Cassandra

?

?

Apache ZooKeeper

?

?

OpenLDAP

?

?

ฐานข้อมูล PostgreSQL

?

?

Qpid

?

?

เราเตอร์ Nginx

?

?

?

โดยทั่วไป หลังจากติดตั้ง Apigee Edge แล้ว คุณจะทําการตรวจสอบต่อไปนี้เพื่อติดตามประสิทธิภาพของการติดตั้ง Apigee Edge สําหรับระบบคลาวด์ส่วนตัวได้

การตรวจสอบประสิทธิภาพการทํางานของระบบ

การวัดพารามิเตอร์ด้านประสิทธิภาพของระบบ เช่น การใช้งาน CPU, การใช้งานหน่วยความจํา และการเชื่อมต่อพอร์ตในระดับที่สูงขึ้นนั้นสำคัญอย่างยิ่ง คุณสามารถตรวจสอบพารามิเตอร์ต่อไปนี้เพื่อดูข้อมูลเบื้องต้นเกี่ยวกับสถานะของระบบ

  • การใช้งาน CPU - ระบุสถิติพื้นฐาน (ผู้ใช้/ระบบ/IO/รอ/ไม่มีการใช้งาน) เกี่ยวกับการใช้งาน CPU เช่น CPU ทั้งหมดที่ระบบใช้
  • หน่วยความจําว่าง/ที่ใช้ - ระบุการใช้งานหน่วยความจําของระบบเป็นไบต์ เช่น หน่วยความจําจริงที่ระบบใช้
  • การใช้พื้นที่ในดิสก์ – ระบุข้อมูลระบบไฟล์ตามการใช้งานดิสก์ปัจจุบัน เช่น พื้นที่ฮาร์ดดิสก์ที่ระบบใช้
  • ค่าเฉลี่ยของการโหลด - ระบุจํานวนกระบวนการที่รอทํางาน
  • สถิติเครือข่าย – แพ็กเก็ตและ/หรือไบต์ของเครือข่ายที่ส่งและรับ พร้อมด้วยข้อผิดพลาดในการส่งเกี่ยวกับคอมโพเนนต์ที่ระบุ

การตรวจสอบกระบวนการ/แอปพลิเคชัน

ในระดับกระบวนการ คุณสามารถดูข้อมูลสำคัญเกี่ยวกับกระบวนการทั้งหมดที่ทำงานอยู่ เช่น สถิติการใช้งานหน่วยความจำและ CPU ที่กระบวนการหรือแอปพลิเคชันใช้ สําหรับกระบวนการต่างๆ เช่น qpidd, postgres postmaster, java และอื่นๆ คุณสามารถตรวจสอบข้อมูลต่อไปนี้ได้

  • การระบุกระบวนการ: ระบุกระบวนการ Apigee ที่เฉพาะเจาะจง เช่น คุณตรวจสอบได้ว่ามีกระบวนการ Java ของเซิร์ฟเวอร์ Apigee อยู่หรือไม่
  • สถิติเธรด: ดูรูปแบบการแยกเธรดพื้นฐานที่กระบวนการใช้ เช่น คุณสามารถตรวจสอบจำนวนเธรดสูงสุด จำนวนเธรดสำหรับกระบวนการทั้งหมด
  • การใช้งานหน่วยความจำ: ดูการใช้งานหน่วยความจำสำหรับกระบวนการทั้งหมดของ Apigee เช่น คุณสามารถตรวจสอบพารามิเตอร์ต่างๆ เช่น การใช้หน่วยความจำฮีป การใช้หน่วยความจำที่ไม่ใช่ฮีปซึ่งกระบวนการหนึ่งๆ ใช้

การตรวจสอบระดับ API

ในระดับ API คุณสามารถตรวจสอบว่าเซิร์ฟเวอร์ทำงานอยู่หรือไม่สําหรับการเรียก API ที่ใช้บ่อยซึ่ง Apigee เป็นพร็อกซี เช่น คุณสามารถตรวจสอบ API ในเซิร์ฟเวอร์การจัดการ รูทเตอร์ และโปรแกรมประมวลผลข้อความได้โดยเรียกใช้คำสั่ง cURL ต่อไปนี้

curl http://<host>:<port>/v1/servers/self/up

โดยที่ <host> คือที่อยู่ IP ของคอมโพเนนต์ Apigee Edge หมายเลข <port> จะใช้กับคอมโพเนนต์ Edge แต่ละรายการเท่านั้น เช่น

เซิร์ฟเวอร์การจัดการ: 8080

  • เราเตอร์: 8081
  • Message Processor: 8082
  • ฯลฯ

ดูข้อมูลเกี่ยวกับการเรียกใช้คําสั่งนี้สําหรับคอมโพเนนต์แต่ละรายการในส่วนต่างๆ ด้านล่าง

การเรียกใช้นี้จะแสดงผลเป็น "จริง" และ "เท็จ" คุณยังเรียก API โดยตรงในแบ็กเอนด์ (ซึ่งซอฟต์แวร์ Apigee โต้ตอบด้วย) เพื่อให้ทราบอย่างรวดเร็วว่ามีข้อผิดพลาดเกิดขึ้นภายในสภาพแวดล้อมซอฟต์แวร์ Apigee หรือในแบ็กเอนด์

หมายเหตุ: หากต้องการตรวจสอบพร็อกซี API คุณสามารถใช้สถานะ API ของ Apigee ได้ด้วย ประสิทธิภาพของ API จะทําการเรียกพร็อกซี API ตามกำหนดการและแจ้งให้คุณทราบเมื่อการเรียกไม่สําเร็จและสาเหตุ เมื่อการเรียกใช้สําเร็จ สถานะ API จะแสดงเวลาในการตอบสนองและยังแจ้งให้คุณทราบได้เมื่อเวลาในการตอบสนองสูง API ของ Google Health สามารถโทรจากสถานที่ต่างๆ ทั่วโลกเพื่อเปรียบเทียบลักษณะการทํางานของ API ระหว่างภูมิภาค

การตรวจสอบขั้นตอนของข้อความ

คุณสามารถรวบรวมข้อมูลจากเราเตอร์และโปรแกรมประมวลผลข้อความเกี่ยวกับรูปแบบ/สถิติของการรับส่งข้อความ ซึ่งช่วยให้คุณตรวจสอบสิ่งต่อไปนี้ได้

  • จํานวนลูกค้าที่ใช้งานอยู่
  • จำนวนการตอบสนอง (10 เท่า, 20 เท่า, 30 เท่า, 40 เท่า และ 50 เท่า)
  • การเชื่อมต่อไม่สำเร็จ

ซึ่งจะช่วยให้คุณระบุหน้าแดชบอร์ดสำหรับขั้นตอนการส่งข้อความ API ได้ ดูข้อมูลเพิ่มเติมได้ที่

การตรวจสอบประสิทธิภาพของเราเตอร์ของ Message Processor

เราเตอร์ใช้กลไกการตรวจสอบประสิทธิภาพการทำงานเพื่อระบุว่าตัวประมวลผลข้อความใดทำงานตามที่คาดไว้ หากตรวจพบว่าตัวประมวลผลข้อความไม่ทำงานหรือทำงานช้า เราเตอร์จะนำตัวประมวลผลข้อความออกจากการหมุนเวียนโดยอัตโนมัติ หากเป็นเช่นนั้น เราเตอร์จะเขียนข้อความ "Mark Down" ลงในไฟล์บันทึกของเราเตอร์ที่ /opt/apigee/var/log/edge-router/logs/system.log

คุณสามารถตรวจสอบไฟล์บันทึกของ Router เพื่อดูข้อความเหล่านี้ ตัวอย่างเช่น หากเราเตอร์นำตัวประมวลผลข้อความออกจากการหมุนเวียน ระบบจะเขียนข้อความลงในบันทึกในรูปแบบต่อไปนี้

2014-05-06 15:51:52,159 org: env: RPCClientClientProtocolChildGroup-RPC-0 INFO CLUSTER - ServerState.setState() : State of 2a8a0e0c-3619-416f-b037-8a42e7ad4577 is now DISCONNECTED. handle = <MP_IP> at 1399409512159

2014-04-17 12:54:48,512 org: env: nioEventLoopGroup-2-2 INFO HEARTBEAT - HBTracker.gotResponse() : No HeartBeat detected from /<MP_IP>:<PORT> Mark Down

โดยที่ /<MP_IP>:<PORT> คือที่อยู่ IP และหมายเลขพอร์ตของโปรแกรมประมวลผลข้อความ

หากภายหลังเราเตอร์ทำการตรวจสอบประสิทธิภาพและพบว่าตัวประมวลผลข้อความทํางานได้อย่างถูกต้อง เราเตอร์จะใส่ตัวประมวลผลข้อความกลับเข้ารอบโดยอัตโนมัติ รูทเตอร์จะเขียนข้อความ "มาร์กอัป" ลงในบันทึกในรูปแบบต่อไปนี้ด้วย

2014-05-06 16:07:29,054 org: env: RPCClientClientProtocolChildGroup-RPC-0 INFO CLUSTER - ServerState.setState() : State of 2a8a0e0c-3619-416f-b037-8a42e7ad4577 is now CONNECTED. handle = <IP> at 1399410449054

2014-04-17 12:55:06,064 org: env: nioEventLoopGroup-4-1 INFO HEARTBEAT - HBTracker.updateHB() : HeartBeat detected from /<IP>:<PORT> Mark Up