สิ่งที่ควรตรวจสอบ

Edge for Private Cloud v. 4.17.09

โดยทั่วไปในการตั้งค่าเวอร์ชันที่ใช้งานจริง คุณจะต้องเปิดใช้กลไกการตรวจสอบภายในการติดตั้งใช้งาน Apigee Edge สําหรับระบบคลาวด์ส่วนตัว เทคนิคการตรวจสอบเหล่านี้จะเตือนผู้ดูแลระบบเครือข่าย (หรือผู้ให้บริการ) เกี่ยวกับข้อผิดพลาดหรือความล้มเหลว ระบบจะรายงานข้อผิดพลาดทั้งหมดที่เกิดขึ้นเป็นการแจ้งเตือนใน Apigee Edge โปรดดูข้อมูลเพิ่มเติมเกี่ยวกับการแจ้งเตือนในแนวทางปฏิบัติแนะนำในการตรวจสอบ

คอมโพเนนต์ Apigee แบ่งออกเป็น 2 หมวดหมู่หลักเพื่อความสะดวก

  • บริการเซิร์ฟเวอร์ Java สำหรับ Apigee โดยเฉพาะ ซึ่งรวมถึงเซิร์ฟเวอร์การจัดการ เครื่องประมวลผลข้อความ เซิร์ฟเวอร์ Qpid และเซิร์ฟเวอร์ Postgres
  • บริการของบุคคลที่สาม ได้แก่ เราเตอร์ Nginx, Apache Cassandra, Apache ZooKeeper, OpenLDAP, ฐานข้อมูล PostgreSQL และ Qpid

ตารางต่อไปนี้แสดงข้อมูลโดยย่อเกี่ยวกับพารามิเตอร์ที่คุณตรวจสอบได้ ในการทำให้ Apigee Edge ใช้งานได้ภายในองค์กร

ส่วนประกอบ

การตรวจสอบระบบ

สถิติระดับกระบวนการ

การตรวจสอบระดับ API

การตรวจสอบโฟลว์ข้อความ

เฉพาะคอมโพเนนต์

บริการ Java สำหรับ Apigee โดยเฉพาะ

เซิร์ฟเวอร์การจัดการ

?

?

?

Message Processor

?

?

?

?

เซิร์ฟเวอร์ Qpid

?

?

?

เซิร์ฟเวอร์ Postgres

?

?

?

บริการของบุคคลที่สาม

Apache Cassandra

?

?

Apache ZooKeeper

?

?

OpenLDAP

?

?

ฐานข้อมูล PostgreSQL

?

?

Qpid

?

?

เราเตอร์ Nginx

?

?

?

โดยทั่วไป หลังจากติดตั้ง Apigee Edge แล้ว คุณจะทําการตรวจสอบต่อไปนี้เพื่อติดตามประสิทธิภาพของการติดตั้ง Apigee Edge สําหรับระบบคลาวด์ส่วนตัวได้

การตรวจสอบประสิทธิภาพการทํางานของระบบ

การวัดพารามิเตอร์ด้านประสิทธิภาพของระบบ เช่น การใช้งาน CPU, การใช้งานหน่วยความจํา และการเชื่อมต่อพอร์ตในระดับที่สูงขึ้นนั้นสำคัญอย่างยิ่ง คุณสามารถตรวจสอบพารามิเตอร์ต่อไปนี้เพื่อดูข้อมูลเบื้องต้นเกี่ยวกับสถานะของระบบ

  • การใช้งาน CPU – ระบุสถิติพื้นฐาน (ผู้ใช้/ระบบ/IO รอ/ไม่มีการใช้งาน) เกี่ยวกับการใช้งาน CPU เช่น CPU ทั้งหมดที่ระบบใช้
  • หน่วยความจําว่าง/ที่ใช้ - ระบุการใช้งานหน่วยความจําของระบบเป็นไบต์ เช่น หน่วยความจำทางกายภาพที่ระบบใช้
  • การใช้พื้นที่ในดิสก์ – ระบุข้อมูลระบบไฟล์ตามการใช้งานดิสก์ปัจจุบัน เช่น พื้นที่ฮาร์ดดิสก์ที่ระบบใช้
  • ค่าเฉลี่ยของการโหลด - ระบุจํานวนกระบวนการที่รอทํางาน
  • สถิติเครือข่าย – แพ็กเก็ตและ/หรือไบต์ของเครือข่ายที่ส่งและรับ พร้อมด้วยข้อผิดพลาดในการส่งเกี่ยวกับคอมโพเนนต์ที่ระบุ

การตรวจสอบกระบวนการ/แอปพลิเคชัน

ในระดับกระบวนการ คุณสามารถดูข้อมูลสำคัญเกี่ยวกับกระบวนการทั้งหมดที่ทำงานอยู่ เช่น สถิติการใช้งานหน่วยความจำและ CPU ที่กระบวนการหรือแอปพลิเคชันใช้ สําหรับกระบวนการต่างๆ เช่น qpidd, postgres postmaster, java และอื่นๆ คุณสามารถตรวจสอบข้อมูลต่อไปนี้ได้

  • การระบุกระบวนการ: ระบุกระบวนการ Apigee ที่เฉพาะเจาะจง เช่น คุณตรวจสอบได้ว่ามีกระบวนการ Java ของเซิร์ฟเวอร์ Apigee อยู่หรือไม่
  • สถิติชุดข้อความ: ดูรูปแบบของชุดข้อความที่เกี่ยวข้องที่กระบวนการใช้ เช่น คุณสามารถตรวจสอบจํานวนชุดข้อความสูงสุด จํานวนชุดข้อความสําหรับกระบวนการทั้งหมด
  • การใช้งานหน่วยความจำ: ดูการใช้งานหน่วยความจำสำหรับกระบวนการทั้งหมดของ Apigee เช่น คุณสามารถตรวจสอบพารามิเตอร์ต่างๆ เช่น การใช้หน่วยความจำฮีป การใช้หน่วยความจำที่ไม่ใช่ฮีปซึ่งกระบวนการหนึ่งๆ ใช้

การตรวจสอบระดับ API

ในระดับ API คุณสามารถตรวจสอบว่าเซิร์ฟเวอร์ทำงานอยู่หรือไม่สําหรับการเรียก API ที่ใช้บ่อยซึ่ง Apigee เป็นพร็อกซี เช่น คุณสามารถตรวจสอบ API ในเซิร์ฟเวอร์การจัดการ รูทเตอร์ และโปรแกรมประมวลผลข้อความได้โดยเรียกใช้คำสั่ง cURL ต่อไปนี้

curl http://<host>:<port>/v1/servers/self/up

โดยที่ <host> คือที่อยู่ IP ของคอมโพเนนต์ Apigee Edge หมายเลข <port> จะใช้กับคอมโพเนนต์ Edge แต่ละรายการเท่านั้น เช่น

เซิร์ฟเวอร์การจัดการ: 8080

  • เราเตอร์: 8081
  • ตัวประมวลผลข้อความ: 8082
  • ฯลฯ

ดูข้อมูลเกี่ยวกับการเรียกใช้คําสั่งนี้สําหรับคอมโพเนนต์แต่ละรายการในส่วนต่างๆ ด้านล่าง

การเรียกใช้นี้จะแสดงผลเป็น "จริง" และ "เท็จ" คุณยังเรียก API โดยตรงในแบ็กเอนด์ (ซึ่งซอฟต์แวร์ Apigee โต้ตอบด้วย) เพื่อให้ทราบได้อย่างรวดเร็วว่ามีข้อผิดพลาดเกิดขึ้นภายในสภาพแวดล้อมซอฟต์แวร์ Apigee หรือในแบ็กเอนด์

หมายเหตุ: คุณยังใช้ประสิทธิภาพ API ของ Apigee เพื่อตรวจสอบพร็อกซี API ได้ด้วย ประสิทธิภาพของ API จะทําการเรียกพร็อกซี API ตามกำหนดการและแจ้งให้คุณทราบเมื่อการเรียกไม่สําเร็จและสาเหตุ เมื่อการเรียกใช้สําเร็จ สถานะ API จะแสดงเวลาในการตอบสนองและยังแจ้งให้คุณทราบได้เมื่อเวลาในการตอบสนองสูง API ของ Google Health สามารถโทรจากสถานที่ต่างๆ ทั่วโลกเพื่อเปรียบเทียบลักษณะการทํางานของ API ระหว่างภูมิภาค

การตรวจสอบขั้นตอนของข้อความ

คุณเก็บข้อมูลจากเราเตอร์และผู้ประมวลผลข้อความเกี่ยวกับรูปแบบ/สถิติการรับส่งของข้อความได้ ซึ่งช่วยให้คุณตรวจสอบสิ่งต่อไปนี้ได้

  • จำนวนไคลเอ็นต์ที่ใช้งานอยู่
  • จำนวนการตอบสนอง (10 เท่า, 20 เท่า, 30 เท่า, 40 เท่า และ 50 เท่า)
  • การเชื่อมต่อไม่สำเร็จ

ซึ่งจะช่วยให้คุณกำหนดแดชบอร์ดสำหรับโฟลว์ข้อความ API ได้ ดูข้อมูลเพิ่มเติมได้ที่

การตรวจสอบประสิทธิภาพของเราเตอร์ของ Message Processor

เราเตอร์ใช้กลไกการตรวจสอบประสิทธิภาพการทำงานเพื่อระบุว่าตัวประมวลผลข้อความใดทำงานตามที่คาดไว้ หากตรวจพบว่าตัวประมวลผลข้อความทำงานช้าลงหรือช้า เราเตอร์อาจถอดตัวประมวลผลข้อความออกจากการหมุนได้โดยอัตโนมัติ หากเป็นเช่นนั้น เราเตอร์จะเขียนข้อความ "Mark Down" ลงในไฟล์บันทึกของเราเตอร์ที่ /opt/apigee/var/log/edge-router/logs/system.log

คุณสามารถตรวจสอบไฟล์บันทึกของ Router เพื่อดูข้อความเหล่านี้ ตัวอย่างเช่น หากเราเตอร์นำตัวประมวลผลข้อความออกจากการหมุนเวียน ระบบจะเขียนข้อความลงในบันทึกในรูปแบบต่อไปนี้

2014-05-06 15:51:52,159 org: env: RPCClientClientProtocolChildGroup-RPC-0 INFO CLUSTER - ServerState.setState() : State of 2a8a0e0c-3619-416f-b037-8a42e7ad4577 is now DISCONNECTED. handle = <MP_IP> at 1399409512159

2014-04-17 12:54:48,512 org: env: nioEventLoopGroup-2-2 INFO HEARTBEAT - HBTracker.gotResponse() : No HeartBeat detected from /<MP_IP>:<PORT> Mark Down

โดยที่ /<MP_IP>:<PORT> คือที่อยู่ IP และหมายเลขพอร์ตของโปรแกรมประมวลผลข้อความ

หากภายหลังเราเตอร์ทำการตรวจสอบประสิทธิภาพและพบว่าตัวประมวลผลข้อความทํางานได้อย่างถูกต้อง เราเตอร์จะใส่ตัวประมวลผลข้อความกลับเข้ารอบโดยอัตโนมัติ รูทเตอร์จะเขียนข้อความ "มาร์กอัป" ลงในบันทึกในรูปแบบต่อไปนี้ด้วย

2014-05-06 16:07:29,054 org: env: RPCClientClientProtocolChildGroup-RPC-0 INFO CLUSTER - ServerState.setState() : State of 2a8a0e0c-3619-416f-b037-8a42e7ad4577 is now CONNECTED. handle = <IP> at 1399410449054

2014-04-17 12:55:06,064 org: env: nioEventLoopGroup-4-1 INFO HEARTBEAT - HBTracker.updateHB() : HeartBeat detected from /<IP>:<PORT> Mark Up