ज़ूकीपर कनेक्शन लॉस एरर

आपको Apigee Edge दस्तावेज़ दिख रहा है.
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है इस पेज पर जाएं Apigee X दस्तावेज़.
जानकारी

समस्या का ब्यौरा

ZooKeeper कनेक्टिविटी की समस्याओं के अलग-अलग लक्षण दिख सकते हैं. जैसे:

  1. एपीआई प्रॉक्सी डिप्लॉयमेंट से जुड़ी गड़बड़ियां
  2. Management API कॉल, 5XX गड़बड़ियों के साथ पूरे नहीं हो पाते
  3. राऊटर या मैसेज प्रोसेसर चालू नहीं हो पा रहे हैं
  4. Analytics के कॉम्पोनेंट, system.logs में ZooKeeper के कनेक्शन में होने वाली कमी की शिकायत करते हैं

गड़बड़ी के मैसेज

यहां गड़बड़ी के मैसेज के ऐसे उदाहरण दिए गए हैं जो ऐसी स्थिति में देखे जा सकते हैं ज़ूकीपर नोड से कनेक्शन टूटना.

  1. एपीआई प्रॉक्सी डिप्लॉयमेंट के दौरान मैनेजमेंट सर्वर लॉग में यह गड़बड़ी दिखती है ZooKeeper का कनेक्शन टूट जाने की वजह से फ़ेल हो गया:
    org: env: main INFO ZOOKEEPER - ZooKeeperServiceImpl.exists() :
    Retry path existence path:
      /regions/dc-1/pods/analytics/servers/692afe93-8010-45c6-b37d-e4e05b6b2eb5/reachable,
      reason: KeeperErrorCode = ConnectionLoss
    org: env: main ERROR ZOOKEEPER - ZooKeeperServiceImpl.exists() :
      Could not detect existence of path:
      /regions/dc-1/pods/analytics/servers/692afe93-8010-45c6-b37d-e4e05b6b2eb5/reachable ,
      reason: KeeperErrorCode = ConnectionLoss
    org: env: main ERROR KERNEL.DEPLOYMENT - ServiceDeployer.startService() :
      ServiceDeployer.deploy() : Got a life cycle exception while starting service
      [ServerRegistrationService, Error while checking path existence for path :
      /regions/dc-1/pods/analytics/servers/692afe93-8010-45c6-b37d-e4e05b6b2eb5/reachable] :
      com.apigee.zookeeper.ZooKeeperException{ code = zookeeper.ErrorCheckingPathExis tence,
      message = Error while checking path existence for path :
      /regions/dc-1/pods/analytics/servers/692afe93-8010-45c6-b37d-e4e05b6b2eb5/reachable,
      associated contexts = []} 2015-03-25 10:22:39,811
    org: env: main ERROR KERNEL - MicroKernel.deployAll() : MicroKernel.deployAll() :
    Error in deploying the deployment : EventService com.apigee.zookeeper.ZooKeeperException:
    Error while checking path existence for path :
      /regions/dc-1/pods/analytics/servers/692afe93-8010-45c6-b37d-e4e05b6b2eb5/reachable
      at com.apigee.zookeeper.impl.ZooKeeperServiceImpl.exists(ZooKeeperServiceImpl.java:339)
      ~[zookeeper-1.0.0.jar:na] at com.apigee.zookeeper.impl.ZooKeeperServiceImpl.exists(
      ZooKeeperServiceImpl.java:323) ~[zookeeper-1.0.0.jar:na] at ... snipped
    
  2. स्टार्टअप के दौरान, राऊटर और मैसेज प्रोसेसर ZooKeeper से कनेक्ट होते हैं. अगर कोई ZooKeeper में कनेक्टिविटी से जुड़ी समस्याओं का समाधान करता है, तो ये कॉम्पोनेंट नीचे दी गई प्रोसेस के साथ शुरू नहीं हो पाएंगे गड़बड़ी:
    2017-08-01 23:20:00,404  CuratorFramework-0 ERROR o.a.c.f.i.CuratorFrameworkImpl
      - CuratorFrameworkImpl.logError() : Background operation retry gave up
    org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss
      at org.apache.zookeeper.KeeperException.create(KeeperException.java:99) ~[zookeeper-3.4.6.jar:3.4.6-1569965]
      at org.apache.curator.framework.imps.CuratorFrameworkImpl.checkBackgroundRetry(CuratorFrameworkImpl.java:710) [curator-framework-2.5.0.jar:na]
      at org.apache.curator.framework.imps.CuratorFrameworkImpl.performBackgroundOperation(CuratorFrameworkImpl.java:827) [curator-framework-2.5.0.jar:na]
      at org.apache.curator.framework.imps.CuratorFrameworkImpl.backgroundOperationsLoop(CuratorFrameworkImpl.java:793) [curator-framework-2.5.0.jar:na]
      at org.apache.curator.framework.imps.CuratorFrameworkImpl.access$400(CuratorFrameworkImpl.java:57) [curator-framework-2.5.0.jar:na]
      at org.apache.curator.framework.imps.CuratorFrameworkImpl$4.call(CuratorFrameworkImpl.java:275) [curator-framework-2.5.0.jar:na]
      at java.util.concurrent.FutureTask.run(FutureTask.java:266) [na:1.8.0_131]
      at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142) [na:1.8.0_131]
      at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617) [na:1.8.0_131]
      at java.lang.Thread.run(Thread.java:748) [na:1.8.0_131]
    
  3. Edge यूज़र इंटरफ़ेस (यूआई) यह गड़बड़ी दिखा सकता है कि यह एपीआई प्रॉक्सी के डिप्लॉयमेंट की स्थिति:
    Error Fetching Deployments
    Error while checking path existence for path: path
    

संभावित कारण

नीचे दी गई टेबल में, इस समस्या की संभावित वजहों की सूची दी गई है:

वजह इसके लिए:
अलग-अलग डेटा सेंटर में नेटवर्क कनेक्टिविटी की समस्या Edge के प्राइवेट क्लाउड के उपयोगकर्ता
ZooKeeper नोड अनुरोध स्वीकार नहीं कर रहा है Edge के प्राइवेट क्लाउड के उपयोगकर्ता

उस समस्या के संभावित समाधान देखने के लिए, टेबल में दिए गए किसी लिंक पर क्लिक करें.

अलग-अलग डेटा सेंटर में नेटवर्क कनेक्टिविटी की समस्या

संक्रमण की जांच

ZooKeeper क्लस्टर में ऐसे नोड हो सकते हैं जो कई क्षेत्रों/डेटा सेंटर में मौजूद होते हैं, जैसे कि DC-1 और DC-2. सामान्य Apigee Edge 2 डीसी टोपोलॉजी में ये चीज़ें होंगी:

  • DC-1 में मतदाताओं के रूप में ZooKeeper सर्वर 1, 2, और 3
  • ज़ूकीपर 4 और 5 को मतदाता के तौर पर और DC-2 में ज़ूकीपर 6 को ऑब्ज़र्वर के तौर पर.

अगर DC-1 क्षेत्र कम हो जाता है या DC-1 और DC-2 के बीच नेटवर्क कनेक्टिविटी टूट जाती है, तो ज़ूकीपर नोड DC-2 में नया लीडर नहीं चुन सकते हैं और वे लीडर से कम्यूनिकेट नहीं कर पाते हैं नोड के लिए अलग-अलग हैं. ज़ूकीपर ऑब्ज़र्वर एक नया लीडर नहीं चुन सकते और DC-2 में दो बचे हुए मतदाताओं को नया नेता चुनने के लिए, कम से कम तीन वोटर नोड को पूरा भरें. इसलिए, DC-2 में ज़ूकीपर्स किसी अनुरोध को प्रोसेस नहीं कर सकता. DC-2 में बाकी के ZooKeeper नोड लूप में चलते रहेंगे लीडर को ढूंढने के लिए, ZooKeeper में वोटर को बचाने की कोशिश करना.

रिज़ॉल्यूशन

इस समस्या को बताए गए क्रम में ठीक करने के लिए, नीचे दिए गए समाधान लागू करें.

अगर इन तरीकों को आज़माने के बाद भी समस्या हल नहीं हो रही है, तो कृपया Apigee सहायता टीम से संपर्क करें.

समाधान #1

  1. नेटवर्क कनेक्टिविटी से जुड़ी समस्या को ठीक करने के लिए, अपने नेटवर्क एडमिन के साथ काम करें डेटा सेंटर.
  2. जब ZooKeeper का ग्रुप, डेटा सेंटर के बीच संपर्क कर पाता है और ZooKeeper लीडर, नोड सही होने चाहिए और अनुरोधों को प्रोसेस करने की सुविधा का इस्तेमाल करना चाहिए.

समाधान #2

  1. अगर नेटवर्क कनेक्टिविटी को ठीक होने में समय लगेगा, तो दूसरा तरीका यह है कि आप उसे फिर से कॉन्फ़िगर करें उस क्षेत्र में ZooKeeper नोड जहां वे मौजूद होते हैं. उदाहरण के लिए, ZooKeeper को फिर से कॉन्फ़िगर करें को DC-2 में क्लस्टर करना होगा, ताकि इस क्षेत्र के तीन ज़ूकीपर नोड सभी मतदाता हों और DC-1 इलाके के ज़ूकीपर्स के zoo.cfg में server.#.
    1. नीचे दिए गए उदाहरण में, zoo.cfg उन दो इलाकों के लिए नोड कॉन्फ़िगर करता है जहां DC-1, us-ea का इस्तेमाल करता है होस्टनेम, जो अमेरिका-पूर्व के इलाके और DC-2 को दिखाता है, us-wo होस्टनेम का इस्तेमाल करता है, जो अमेरिका-पश्चिम क्षेत्र को दिखाता है. (ध्यान दें: सिर्फ़ काम के कॉन्फ़िगरेशन दिखते हैं):
      server.1=zk01ea.us-ea.4.apigee.com:2888:3888
      server.2=zk02ea.us-ea.4.apigee.com:2888:3888
      server.3=zk03ea.us-ea.4.apigee.com:2888:3888
      server.4=zk04wo.us-wo.4.apigee.com:2888:3888
      server.5=zk05wo.us-wo.4.apigee.com:2888:3888
      server.6=zk06wo.us-wo.4.apigee.com:2888:3888:observer
      

      ऊपर दिए गए उदाहरण में, zoo.cfg को नीचे बताए गए तरीके से फिर से कॉन्फ़िगर करें:

      server.1=zk04wo.us-wo.4.apigee.com:2888:3888
      server.2=zk05wo.us-wo.4.apigee.com:2888:3888
      server.3=zk06wo.us-wo.4.apigee.com:2888:3888
      
    2. कॉन्फ़िगरेशन के साथ कोड का इस्तेमाल करके, इनके साथ एक /opt/apigee/customer/application/zookeeper.properties फ़ाइल बनाएं:
      conf_zoo_quorum=server.1=zk04wo.us-wo.4.apigee.com:2888:3888\
      \nserver.2=zk05wo.us-wo.4.apigee.com:2888:3888\
      \nserver.3=zk06wo.us-wo.4.apigee.com:2888:3888\
      

    ऊपर दिए गए में, अमेरिका-पूर्व के नोड हटा दिए जाते हैं और यूएस-वेस्ट नोड को प्रमोट कर दिया जाता है :observer से जुड़ी जानकारी हटाए जाने पर, वोटर.

  2. /opt/apigee/apigee-zookeeper/conf/zoo.cfg और पुराने वर्शन का बैक अप लें /opt/apigee/customer/application/zookeeper.properties.

    नेटवर्क कनेक्टिविटी के वापस आने पर डिफ़ॉल्ट रूप से इन फ़ाइलों को वापस लाने के लिए, इन फ़ाइलों का इस्तेमाल किया जाएगा डेटा सेंटर के बीच स्विच कर सकता है.

  3. ऑब्ज़र्वर नोड के लिए ऑब्ज़र्वर नोटेशन बंद करें. ऐसा करने के लिए, /opt/apigee/customer/application/zookeeper.properties के ऊपर यह कॉन्फ़िगरेशन जोड़ें:

    conf_zoo_peertype=
  4. /opt/apigee/data/apigee-zookeeper/data/myid फ़ाइल में इस तरह से बदलाव करें:

    • server.1 के लिए, myid के अंदर की एंट्री को 4 से बदलकर 1 करें.
    • server.2 के लिए, myid को 5 से बदलकर 2 करें.
    • server.3 के लिए, myid को 6 से बदलकर 3 करें.
  5. उस क्षेत्र में ZooKeeper नोड रीस्टार्ट करें जहां आपने ZooKeeper को फिर से कॉन्फ़िगर किया है क्लस्टर.
  6. इसमें सभी ZooKeeper नोड पर चरण #1b से चरण# 5 तक ऊपर दिया गया कॉन्फ़िगरेशन दोहराएं डीसी-2.
  7. पुष्टि करें कि नोड नेता के हिसाब से काम कर रहे हैं:
    $ echo srvr | nc zk04wo.us-wo.4.apigee.com 2181
    > echo srvr | nc zk05wo.us-wo.4.apigee.com 2181
    > echo srvr | nc zk06wo.us-wo.4.apigee.com 2181
    

    इस निर्देश के आउटपुट में "mode" लिखा होगा उसके बाद "लीडर" अगर यह लीडर या "फ़ॉलोअर" है अगर वह फ़ॉलोअर है.

    डेटा सेंटर के बीच नेटवर्क फिर से आने पर, ZooKeeper कॉन्फ़िगरेशन DC-2 में ZooKeeper नोड पर बदलावों को पहले जैसा किया जा सकता है.

समाधान #3

  1. अगर क्लस्टर में ZooKeeper नोड शुरू नहीं होते हैं, तो उसे रीस्टार्ट करें.
  2. ZooKeeper नोड कम क्यों हुआ, यह पता लगाने के लिए ZooKeeper के लॉग देखें.

    ZooKeeper के लॉग इन डायरेक्ट्री में उपलब्ध हैं:

    $ cd /opt/apigee/var/log/apigee-zookeeper
    $ ls -l
    total 188
    -rw-r--r--. 1 apigee apigee   2715 Jul 22 19:51 apigee-zookeeper.log
    -rw-r--r--. 1 apigee apigee  10434 Jul 17 19:51 config.log
    -rw-r--r--. 1 apigee apigee 169640 Aug  1 19:51 zookeeper.log
    
  3. Apigee सहायता से संपर्क करें और किसी भी ऐसे ZooKeeper नोड की समस्या हल करने के लिए, ZooKeeper लॉग करें जिसे शायद रोका गया हो.

ZooKeeper नोड अनुरोध स्वीकार नहीं कर रहा है

एन्सेंबल में मौजूद ZooKeeper नोड खराब हो सकता है और क्लाइंट को जवाब नहीं दे पाएगा अनुरोध. ऐसा इन वजहों से हो सकता है:

  1. नोड को रीस्टार्ट किए बिना ही रोक दिया गया.
  2. नोड को अपने-आप चालू होने की सुविधा के बिना फिर से चालू किया गया.
  3. नोड पर सिस्टम लोड होने की वजह से वह कम हो गया या खराब हो गया.

संक्रमण की जांच

  1. हर ZooKeeper नोड पर नीचे दिए गए ZooKeeper हेल्थ चेक कमांड एक्ज़ीक्यूट करें और आउटपुट की जाँच करें:
    1. $ echo "ruok" | nc localhost 2181
      

      आउटपुट का उदाहरण:

      $ echo "ruok" | nc localhost 2181
      imok
      
    2. echo srvr | nc localhost 2181
      

      मोड की जांच करके तय करें कि ZooKeeper नोड कोई लीडर है या फ़ॉलोअर.

      एक ही जगह पर सभी के लिए आउटपुट का उदाहरण: एक छोटा ZooKeeper नोड:

      $ echo srvr | nc localhost 2181
      ZooKeeper version: 3.4.5-1392090, built on 09/30/2012 17:52 GMT
      Latency min/avg/max: 0/0/88
      Received: 4206601
      Sent: 4206624
      Connections: 8
      Outstanding: 0
      Zxid: 0x745
      Mode: standalone
      Node count: 282
      
    3. $ echo mntr | nc localhost 2181
      

      यह निर्देश ZooKeeper वैरिएबल की सूची दिखाता है, जिसका इस्तेमाल इनके स्वास्थ्य की जाँच करने के लिए किया जा सकता है के रूप में जाना जाता है.

      आउटपुट का उदाहरण:

      $ echo mntr | nc localhost 2181
      zk_version 3.4.5-1392090, built on 09/30/2012 17:52 GMT
      zk_avg_latency 0
      zk_max_latency 88
      zk_min_latency 0
      zk_packets_received     4206750
      zk_packets_sent 4206773
      zk_num_alive_connections 8
      zk_outstanding_requests 0
      zk_server_state standalone
      zk_znode_count 282
      zk_watch_count 194
      zk_ephemerals_count 1
      zk_approximate_data_size 22960
      zk_open_file_descriptor_count 34
      zk_max_file_descriptor_count 4096
      
    4. $ echo stat | nc localhost 2181
      

      इस निर्देश में परफ़ॉर्मेंस और उससे जुड़े क्लाइंट के आंकड़े दिए गए हैं.

      आउटपुट का उदाहरण:

      $ echo stat | nc localhost 2181
      ZooKeeper version: 3.4.5-1392090, built on 09/30/2012 17:52 GMT
      Clients:
       /10.128.0.8:54152[1](queued=0,recved=753379,sent=753385)
       /10.128.0.8:53944[1](queued=0,recved=980269,sent=980278)
       /10.128.0.8:54388[1](queued=0,recved=457094,sent=457094)
       /10.128.0.8:54622[1](queued=0,recved=972938,sent=972938)
       /10.128.0.8:54192[1](queued=0,recved=150843,sent=150843)
       /10.128.0.8:44564[1](queued=0,recved=267332,sent=267333)
       /127.0.0.1:40820[0](queued=0,recved=1,sent=0)
       /10.128.0.8:53960[1](queued=0,recved=150844,sent=150844)
      
      Latency min/avg/max: 0/0/88
      Received: 4206995
      Sent: 4207018
      Connections: 8
      Outstanding: 0
      Zxid: 0x745
      Mode: standalone
      Node count: 282
      
    5. $ echo cons | nc localhost 2181
      

      यह निर्देश, ZooKeeper के कनेक्शन की ज़्यादा जानकारी देता है.

      आउटपुट का उदाहरण:

      $ echo cons | nc localhost 2181
      /127.0.0.1:40864[0](queued=0,recved=1,sent=0)
      /10.128.0.8:54152[1](queued=0,recved=753400,sent=753406,sid=0x15d521a96d40007,
        lop=PING,est=1500321588647,to=40000,lcxid=0x972e9,lzxid=0x745,lresp=1502334173174,
        llat=0,minlat=0,avglat=0,maxlat=26)
      /10.128.0.8:53944[1](queued=0,recved=980297,sent=980306,sid=0x15d521a96d40005,
        lop=PING,est=1500321544896,to=40000,lcxid=0xce92a,lzxid=0x745,lresp=1502334176055,
        llat=0,minlat=0,avglat=0,maxlat=23)
      /10.128.0.8:54388[1](queued=0,recved=457110,sent=457110,sid=0x15d521a96d4000a,
        lop=PING,est=1500321673852,to=40000,lcxid=0x4dbe3,lzxid=0x745,lresp=1502334174245,
        llat=0,minlat=0,avglat=0,maxlat=22)
      /10.128.0.8:54622[1](queued=0,recved=972967,sent=972967,sid=0x15d521a96d4000b,
        lop=PING,est=1500321890175,to=40000,lcxid=0xccc9d,lzxid=0x745,lresp=1502334182417,
        llat=0,minlat=0,avglat=0,maxlat=88)
      /10.128.0.8:54192[1](queued=0,recved=150848,sent=150848,sid=0x15d521a96d40008,
        lop=PING,est=1500321591985,to=40000,lcxid=0x8,lzxid=0x745,lresp=1502334184475,
        llat=3,minlat=0,avglat=0,maxlat=19)
      /10.128.0.8:44564[1](queued=0,recved=267354,sent=267355,sid=0x15d521a96d4000d,
        lop=PING,est=1501606633426,to=40000,lcxid=0x356e2,lzxid=0x745,lresp=1502334182315,
        llat=0,minlat=0,avglat=0,maxlat=35)
      /10.128.0.8:53960[1](queued=0,recved=150848,sent=150848,sid=0x15d521a96d40006,
        lop=PING,est=1500321547138,to=40000,lcxid=0x5,lzxid=0x745,lresp=1502334177036,
        llat=1,minlat=0,avglat=0,maxlat=20)
      

      अगर परफ़ॉर्मेंस की जांच के लिए दिए गए आखिरी तीन निर्देशों में से कोई भी यह मैसेज दिखाता है:

      $ echo stat | nc localhost 2181
          This ZooKeeper instance is not currently serving requests
      

      इसके बाद यह बताता है कि खास ZooKeeper नोड अनुरोध स्वीकार नहीं कर रहा है.

  2. किसी खास नोड पर ZooKeeper लॉग देखें और गड़बड़ी की वजह से होने वाली गड़बड़ियों का पता लगाने की कोशिश करें ZooKeeper बंद करना है. ZooKeeper के लॉग इन डायरेक्ट्री में उपलब्ध हैं:
    $ cd /opt/apigee/var/log/apigee-zookeeper
    $ ls -l
    total 188
    -rw-r--r--. 1 apigee apigee   2715 Jul 22 19:51 apigee-zookeeper.log
    -rw-r--r--. 1 apigee apigee  10434 Jul 17 19:51 config.log
    -rw-r--r--. 1 apigee apigee 169640 Aug  1 19:51 zookeeper.log
    

रिज़ॉल्यूशन

  1. क्लस्टर में मौजूद बाकी सभी ZooKeeper नोड को एक-एक करके रीस्टार्ट करें.
  2. हर नोड पर ZooKeeper की हेल्थ जांच करने वाले निर्देश फिर से चलाएं और देखें कि आपको उम्मीद के मुताबिक नतीजे मिल रहे हैं या नहीं आउटपुट.

समस्या हल करने के लिए, Apigee सहायता टीम से संपर्क करें सिस्टम लोड होगा अगर यह बनी रहती है या रीस्टार्ट होने से समस्या का समाधान नहीं होता है.