Google Cloud विज़न एक्सटेंशन

Apigee Edge का दस्तावेज़ देखा जा रहा है.
Apigee X के दस्तावेज़ पर जाएं.
जानकारी

वर्शन: 2.0.0

मशीन लर्निंग मॉडल का इस्तेमाल करके, इमेज में मौजूद कॉन्टेंट और टेक्स्ट का पता लगाएं.

इस कॉन्टेंट में, इस एक्सटेंशन को कॉन्फ़िगर करने और इस्तेमाल करने के बारे में जानकारी दी गई है. एपीआई प्रॉक्सी से इस एक्सटेंशन का इस्तेमाल करने से पहले, आपको ये काम करने होंगे:

  1. अपने सेवा खाते के लिए, Cloud Vision API चालू करें.

  2. अगर आपको इमेज के सोर्स के तौर पर Cloud Storage का इस्तेमाल करना है, तो आपको इस एक्सटेंशन के लिए Cloud Storage का ऐक्सेस भी देना होगा. इसके बारे में Google Cloud Storage एक्सटेंशन के रेफ़रंस में बताया गया है.

  3. अगर आपके पास ऐसा सेवा खाता है जिसके पास Cloud Vision और Cloud Storage (अगर इसका इस्तेमाल किया जा रहा है) की अनुमति है, तो सेवा खाते के लिए पासकोड जनरेट करने के लिए, GCP Console का इस्तेमाल करें.

  4. कॉन्फ़िगरेशन रेफ़रंस का इस्तेमाल करके एक्सटेंशन को जोड़ने और कॉन्फ़िगर करने के दौरान, जनरेट हुई कुंजी वाली JSON फ़ाइल के कॉन्टेंट का इस्तेमाल करें.

Cloud Vision के बारे में जानकारी

Google Cloud Vision API, इमेज का विश्लेषण करने के लिए मशीन लर्निंग मॉडल का इस्तेमाल करता है. एपीआई के इस्तेमाल के लिए, किसी मॉडल को ट्रेनिंग दी जा सकती है या पहले से मौजूद मॉडल का इस्तेमाल किया जा सकता है.

Cloud Vision, पहले से मौजूद मॉडल का इस्तेमाल करके, इमेज को "स्काईस्क्रेपर", "सैलबोट", "शेर" या "ईफ़ेल टावर" जैसी कैटगरी में बांटता है. यह इमेज में मौजूद ऑब्जेक्ट, चेहरों, लोगो, और लैंडमार्क की पहचान करता है. साथ ही, इमेज में मौजूद शब्दों का पता लगाता है.

सैंपल

यहां दिए गए उदाहरणों में, ExtensionCallout नीति का इस्तेमाल करके, Cloud Vision एक्सटेंशन ऐक्शन के लिए सहायता कॉन्फ़िगर करने का तरीका बताया गया है.

लेबल का पता लगाना

नीचे दिए गए उदाहरण में, एक्सटेंशन की detectLabels कार्रवाई, image_uri पर मौजूद इमेज को ऐक्सेस करती है और विश्लेषण के लिए उसे Cloud Vision API को भेजती है. एपीआई, इमेज की जांच करेगा और यह तय करेगा कि इमेज के कॉन्टेंट पर कौनसे लेबल लागू होते हैं.

<?xml version="1.0" encoding="UTF-8&quo>t<; standalone="yes"?
ConnectorCallout async="false" continueOnError="true&>quot;< enabled=&q>uot;true" name=&q<uot;Cloud-Vi>sion-<Extension>"
    DisplayNameCloud Vi<sion Exten>sion/<Displa>yName
    Co<nnector>cloud<-visi><on-extension-example/Connector
    ActiondetectLabels/Action
    Input![CDATA[
    {
        "imag><e_uri&>quot;< : &qu>ot;gs://cloud-vision-ex<ample/e>m<pire-state-buildi>ng.jpg"
    }
    ]]/Input
    Outputvision.labels.retrieved/Output
/ConnectorCallout

मैसेज असाइन करें नीति में, रिस्पॉन्स पेलोड असाइन करने के लिए, एक्सटेंशन के रिस्पॉन्स को सेव करने वाले वैरिएबल की वैल्यू का इस्तेमाल किया जाता है.

<?xml version="1.0" encoding="UTF-8&quo>t<; standalone="yes"?
AssignMessage async="false" continueOnError=">false<" enab>led="true&q<uot; name=&q>uot;G<et-Image-Labels"
    DisplayNameGet Im>age L<abe>ls/Displa<yName
    AssignTo type="response>" createNew="fa<lse">;/
  <  Set<
        Paylo>ad contentType="application/json"{vision.labels.retrieved}/Payload
    /Set
/AssignMessage

किसी शहरी इलाके की इमेज में, बहुत ऊंची इमारत होने पर, आपको इस तरह का जवाब मिल सकता है:

{
  "labels": [
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "/m/0j_s4",
          "locale": "",
          "description": "metropolitan area",
          "score": 0.9868549704551697,
          "confidence": 0,
          "topicality": 0.9868549704551697,
          "boundingPoly": null
      },
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "/m/079cl",
          "locale": "",
          "description": "skyscraper",
          "score": 0.966157853603363,
          "confidence": 0,
          "topicality": 0.966157853603363,
          "boundingPoly": null
      }
  ]
}

टेक्स्ट का पता लगाना

नीचे दिए गए उदाहरण में, एक्सटेंशन detectText ऐक्शन, image_uri पर मौजूद इमेज को पाता है और विश्लेषण के लिए उसे Cloud Vision API को भेजता है. एपीआई, इमेज की जांच करके उसमें मौजूद टेक्स्ट की पहचान करेगा.

<?xml version="1.0" encoding="UTF-8&quo>t<; standalone="yes"?
ConnectorCallout async="false" continueOnError=">true&<quot; enabl>ed="true&quo<t; name=&quo>t;Clo<ud-Vision>-Text"
    DisplayNameClo<ud Vision >Text/<Displa>yName
    <Connect>orclo<ud-vi><sion-extension-example/Connector
    ActiondetectText/Action
    Input![CDATA[
    {
        &qu><ot;ima>ge_ur<i">; : "gs://cloud-<vision->e<xample/parking-si>gns1.jpg"
    }
    ]]/Input
    Outputvision.text.retrieved/Output
/ConnectorCallout

मैसेज असाइन करें नीति में, रिस्पॉन्स पेलोड असाइन करने के लिए, एक्सटेंशन के रिस्पॉन्स को सेव करने वाले वैरिएबल की वैल्यू का इस्तेमाल किया जाता है.

<?xml version="1.0" encoding="UTF-8&quo>t<; standalone="yes"?
AssignMessage async="false" continueOnError=&quo>t;fal<se" en>abled="tr<ue" nam>e=&qu<ot;Get-Image-Text"
    DisplayNameGet >Image< Te>xt/Displa<yName
    AssignTo type="response>" createNew="<false&qu>ot;/
<    >S<et
        Pay>load contentType="application/json"{vision.text.retrieved}/Payload
    /Set
/AssignMessage

पार्किंग लॉग में साइन वाली इमेज देने पर, आपको इस तरह का जवाब मिल सकता है:

{
  "text": [
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "",
          "locale": "en&qu>ot;,
          "description": "RESERVED\nVISITORPARKING\nPARKING\nONLY\n$150 FINE\n",
          "score": 0,
          "confidence": 0,
          "topicality": 0,
          "boundingPoly": {
              "vertices": [
                  {
                      "x": 64,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 218
                  },
                  {
                      "x": 64,
                      "y": 218
                  }
              ]
          }
      },
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "",
          "locale": "",
          "description": "RESERVED",
          "score": 0,
          "confidence": 0,
          "topicality": 0,
          "boundingPoly": {
              "vertices": [
                  {
                      "x": 243,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 84
                  },
                  {
                      "x": 243,
                      "y": 84
                  }
              ]
          }
      }
   ]
}

कार्रवाइयां

detectLabels

यह सुविधा, किसी इमेज में मौजूद इकाइयों की पहचान करती है और उनके बारे में जानकारी निकालती है. पहचानी गई इकाइयां, कैटगरी के बड़े ग्रुप में शामिल होती हैं. उदाहरण के लिए, इस कार्रवाई का इस्तेमाल करके, ऑब्जेक्ट, जगहों, गतिविधियों, जानवरों की प्रजातियों, प्रॉडक्ट वगैरह की पहचान की जा सकती है.

साथ ही, Cloud Vision API से जुड़ा दस्तावेज़ भी देखना न भूलें.

अनुरोध पैरामीटर

पैरामीटर ब्यौरा टाइप डिफ़ॉल्ट ज़रूरी है
image_uri इमेज का सोर्स. यह इंटरनेट या Google Cloud Storage (फ़ॉर्मैट: gs://bucketname/filename) से हो सकती है. अगर सोर्स Google Cloud Storage है, तो इमेज फ़ाइल सार्वजनिक होनी चाहिए. स्ट्रिंग कोई नहीं. हां.

सिंटैक्स

<Input><![CDATA[{
    "image_uri" : "uri-of-image-t><o-anal>yze"
}
]]/Input

उदाहरण

नीचे दिए गए उदाहरण में, एक्सटेंशन की detectLabels कार्रवाई, विश्लेषण के लिए चुनी गई इमेज को Vision API को भेजती है.

<Input><![CDATA[
{
    "image_uri" : "gs://cloud-vision-example/empire-state-bui><lding.>jpg"
}
]]/Input

जवाब

एक ऑब्जेक्ट, जिसमें लेबल का labels कलेक्शन होता है. यह कलेक्शन, इमेज में पहचानी गई इकाइयों को दिखाता है. ज़्यादा जानकारी के लिए, लेबल का पता लगाना लेख पढ़ें.

detectText

यह सुविधा, चुनी गई इमेज में मौजूद टेक्स्ट का पता लगाती है और उसे निकालती है.

अनुरोध पैरामीटर

पैरामीटर ब्यौरा टाइप डिफ़ॉल्ट ज़रूरी है
image_uri इमेज का सोर्स. यह इंटरनेट या Google Cloud Storage (फ़ॉर्मैट: gs://bucketname/filename) से हो सकती है. अगर सोर्स Google Cloud Storage है, तो इमेज फ़ाइल सार्वजनिक होनी चाहिए. स्ट्रिंग कोई नहीं. हां.

सिंटैक्स

<Input><![CDATA[
{
    "image_uri" : "uri-of-image-t><o-anal>yze"
}
]]/Input

उदाहरण

नीचे दिए गए उदाहरण में, एक्सटेंशन की detectText कार्रवाई, विश्लेषण के लिए चुनी गई इमेज को Vision API को भेजती है.

<Input><![CDATA[
{
    "image_uri" : "gs://cloud-vision-example/parking-s><igns1.>jpg"
}
]]/Input

जवाब

एक ऑब्जेक्ट, जिसमें पहचाने गए टेक्स्ट का text कलेक्शन होता है. ज़्यादा जानकारी के लिए, लेबल का पता लगाना लेख पढ़ें.

कॉन्फ़िगरेशन का रेफ़रंस

एपीआई प्रॉक्सी में इस्तेमाल करने के लिए, इस एक्सटेंशन को कॉन्फ़िगर और डिप्लॉय करते समय इनका इस्तेमाल करें. Apigee console का इस्तेमाल करके एक्सटेंशन को कॉन्फ़िगर करने का तरीका जानने के लिए, एक्सटेंशन जोड़ना और कॉन्फ़िगर करना लेख पढ़ें.

सामान्य एक्सटेंशन प्रॉपर्टी

हर प्रॉपर्टी के लिए नीचे दी गई प्रॉपर्टी मौजूद हैं.

प्रॉपर्टी जानकारी डिफ़ॉल्ट ज़रूरी है
name वह नाम, जिसे आप एक्सटेंशन का यह कॉन्फ़िगरेशन दे रहे हैं. कभी नहीं हां
packageName एक्सटेंशन पैकेज का नाम, जो Apigee Edge से दिया गया है. कभी नहीं हां
version उस एक्सटेंशन पैकेज का वर्शन नंबर जिससे आपको एक्सटेंशन कॉन्फ़िगर करना है. कभी नहीं हां
configuration आप जिस एक्सटेंशन को जोड़ रहे हैं उसके लिए खास तौर पर कॉन्फ़िगरेशन वैल्यू. इस एक्सटेंशन पैकेज के लिए प्रॉपर्टी देखें कभी नहीं हां