Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Google Cloud विज़न एक्सटेंशन

यह Apigee Edge से जुड़ा दस्तावेज़ है.
Apigee X से जुड़ा दस्तावेज़ देखें. info

वर्शन: 2.0.0

मशीन लर्निंग मॉडल का इस्तेमाल करके, इमेज में मौजूद कॉन्टेंट और टेक्स्ट के बारे में जानें.

इस कॉन्टेंट में, इस एक्सटेंशन को कॉन्फ़िगर करने और इसका इस्तेमाल करने के बारे में जानकारी दी गई है. एपीआई प्रॉक्सी से इस एक्सटेंशन का इस्तेमाल करने से पहले, आपको ये काम करने होंगे:

अपने सेवा खाते के लिए, Cloud Vision API चालू करना होगा.
अगर इमेज के सोर्स के तौर पर Cloud Storage का इस्तेमाल किया जा रहा है, तो आपको इस एक्सटेंशन को Cloud Storage का ऐक्सेस भी देना होगा. इसके बारे में, Google Cloud Storage एक्सटेंशन के रेफ़रंस में बताया गया है.
अगर आपके पास ऐसा सेवा खाता है जिसके पास Cloud Vision (और Cloud Storage, अगर इसका इस्तेमाल किया जा रहा है) का ऐक्सेस है, तो सेवा खाते के लिए कुंजी जनरेट करने के लिए Google Cloud Console का इस्तेमाल करें.
एक्सटेंशन को जोड़ने और कॉन्फ़िगर करने के लिए, कॉन्फ़िगरेशन रेफ़रंस का इस्तेमाल करते समय, जनरेट की गई कुंजी वाली JSON फ़ाइल के कॉन्टेंट का इस्तेमाल करें.

Cloud Vision के बारे में जानकारी

Google Cloud Vision API, इमेज का विश्लेषण करने के लिए मशीन लर्निंग मॉडल का इस्तेमाल करता है. एपीआई के लिए किसी मॉडल को ट्रेन किया जा सकता है या फिर, पहले से मौजूद मॉडल का इस्तेमाल किया जा सकता है.

पहले से मौजूद मॉडल का इस्तेमाल करके, Cloud Vision, इमेज को "गगनचुंबी इमारत", "सेलबोट", "शेर" या "एफ़िल टॉवर" जैसी कैटगरी में बांटता है. यह इमेज में मौजूद ऑब्जेक्ट, चेहरों, लोगो, और लैंडमार्क की पहचान करता है. साथ ही, इमेज में मौजूद शब्दों की जगह की जानकारी भी देता है.

सैंपल

यहां दिए गए उदाहरणों में, ExtensionCallout नीति का इस्तेमाल करके, Cloud Vision एक्सटेंशन की कार्रवाइयों के लिए सहायता कॉन्फ़िगर करने का तरीका बताया गया है.

लेबल की पहचान करना

यहां दिए गए उदाहरण में, एक्सटेंशन की detectLabels कार्रवाई, image_uri पर मौजूद इमेज को लेती है और विश्लेषण के लिए इसे Cloud Vision API को पास करती है. एपीआई, इमेज की जांच करेगा और यह तय करेगा कि इमेज के कॉन्टेंट पर कौनसे लेबल लागू होते हैं.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<ConnectorCallout async="false" continueOnError="true" enabled="true" name="Cloud-Vision-Extension">
    <DisplayName>Cloud Vision Extension</DisplayName>
    <Connector>cloud-vision-extension-example</Connector>
    <Action>detectLabels</Action>
    <Input><![CDATA[
    {
        "image_uri" : "gs://cloud-vision-example/empire-state-building.jpg"
    }
    ]]></Input>
    <Output>vision.labels.retrieved</Output>
</ConnectorCallout>

यहां दी गई Assign Message नीति, रिस्पॉन्स पेलोड असाइन करने के लिए, एक्सटेंशन के रिस्पॉन्स को स्टोर करने वाले वैरिएबल की वैल्यू का इस्तेमाल करती है.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<AssignMessage async="false" continueOnError="false" enabled="true" name="Get-Image-Labels">
    <DisplayName>Get Image Labels</DisplayName>
    <AssignTo type="response" createNew="false"/>
    <Set>
        <Payload contentType="application/json">{vision.labels.retrieved}</Payload>
    </Set>
</AssignMessage>

शहरी इलाके की किसी इमेज में, अगर कोई बहुत ऊंची इमारत दिखती है, तो आपको इस तरह का रिस्पॉन्स मिल सकता है:

{
  "labels": [
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "/m/0j_s4",
          "locale": "",
          "description": "metropolitan area",
          "score": 0.9868549704551697,
          "confidence": 0,
          "topicality": 0.9868549704551697,
          "boundingPoly": null
      },
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "/m/079cl",
          "locale": "",
          "description": "skyscraper",
          "score": 0.966157853603363,
          "confidence": 0,
          "topicality": 0.966157853603363,
          "boundingPoly": null
      }
  ]
}

टेक्स्ट की पहचान करना

यहां दिए गए उदाहरण में, एक्सटेंशन की detectText कार्रवाई, image_uri पर मौजूद इमेज को लेती है और विश्लेषण के लिए इसे Cloud Vision API को पास करती है. एपीआई, इमेज की जांच करेगा और इसमें मौजूद टेक्स्ट की पहचान करेगा.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<ConnectorCallout async="false" continueOnError="true" enabled="true" name="Cloud-Vision-Text">
    <DisplayName>Cloud Vision Text</DisplayName>
    <Connector>cloud-vision-extension-example</Connector>
    <Action>detectText</Action>
    <Input><![CDATA[
    {
        "image_uri" : "gs://cloud-vision-example/parking-signs1.jpg"
    }
    ]]></Input>
    <Output>vision.text.retrieved</Output>
</ConnectorCallout>

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<AssignMessage async="false" continueOnError="false" enabled="true" name="Get-Image-Text">
    <DisplayName>Get Image Text</DisplayName>
    <AssignTo type="response" createNew="false"/>
    <Set>
        <Payload contentType="application/json">{vision.text.retrieved}</Payload>
    </Set>
</AssignMessage>

पार्किंग लॉग में मौजूद साइनेज की किसी इमेज के लिए, आपको इस तरह का रिस्पॉन्स मिल सकता है:

{
  "text": [
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "",
          "locale": "en",
          "description": "RESERVED\nVISITORPARKING\nPARKING\nONLY>\n$150 FINE\n",
          "score": 0,
          "confidence": 0,
          "topicality": 0,
          "boundingPoly": {
              "vertices": [
                  {
                      "x": 64,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 218
                  },
                  {
                      "x": 64,
                      "y": 218
                  }
              ]
          }
      },
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "",
          "locale": "",
          "description": "RESERVED",
          "score": 0,
          "confidence": 0,
          "topicality": 0,
          "boundingPoly": {
              "vertices": [
                  {
                      "x": 243,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 84
                  },
                  {
                      "x": 243,
                      "y": 84
                  }
              ]
          }
      }
   ]
}

कार्रवाइयां

detectLabels

यह कार्रवाई, दी गई इमेज में मौजूद इकाइयों की पहचान करती है और उनसे जुड़ी जानकारी निकालती है. पहचान की गई इकाइयां, कई कैटगरी में फैली हो सकती हैं. उदाहरण के लिए, इस कार्रवाई का इस्तेमाल करके, ऑब्जेक्ट, जगहों, गतिविधियों, जानवरों की प्रजातियों, प्रॉडक्ट वगैरह की पहचान की जा सकती है.

इसके अलावा, Cloud Vision API का दस्तावेज़ भी देखें.

अनुरोध के पैरामीटर

पैरामीटर	ब्यौरा	टाइप	डिफ़ॉल्ट	ज़रूरी है
image_uri	इमेज का सोर्स. यह सोर्स, इंटरनेट या Google Cloud Storage हो सकता है. इसका फ़ॉर्मैट `gs://bucketname/filename` होता है. अगर सोर्स Google Cloud Storage है, तो इमेज फ़ाइल सार्वजनिक होनी चाहिए.	स्ट्रिंग	कोई नहीं.	हां.

सिंटैक्स

<Input><![CDATA[{
    "image_uri" : "uri-of-image-to-analyze"
}
]]></Input>

उदाहरण

यहां दिए गए उदाहरण में, एक्सटेंशन की detectLabels कार्रवाई, विश्लेषण के लिए दी गई इमेज को Vision API को भेजती है.

<Input><![CDATA[
{
    "image_uri" : "gs://cloud-vision-example/empire-state-building.jpg"
}
]]></Input>

जवाब

एक ऑब्जेक्ट, जिसमें लेबल की labels कैटगरी होती है. यह कैटगरी, इमेज में पहचानी गई इकाइयों को दिखाती है. ज़्यादा जानकारी के लिए, लेबल की पहचान करना देखें.

detectText

यह कार्रवाई, दी गई इमेज में मौजूद टेक्स्ट की पहचान करती है और उसे निकालती है.

अनुरोध के पैरामीटर

पैरामीटर	ब्यौरा	टाइप	डिफ़ॉल्ट	ज़रूरी है
image_uri	इमेज का सोर्स. यह सोर्स, इंटरनेट या Google Cloud Storage हो सकता है. इसका फ़ॉर्मैट `gs://bucketname/filename` होता है. अगर सोर्स Google Cloud Storage है, तो इमेज फ़ाइल सार्वजनिक होनी चाहिए.	स्ट्रिंग	कोई नहीं.	हां.

सिंटैक्स

<Input><![CDATA[
{
    "image_uri" : "uri-of-image-to-analyze"
}
]]></Input>

उदाहरण

यहां दिए गए उदाहरण में, एक्सटेंशन की detectText कार्रवाई, विश्लेषण के लिए दी गई इमेज को Vision API को भेजती है.

<Input><![CDATA[
{
    "image_uri" : "gs://cloud-vision-example/parking-signs1.jpg"
}
]]></Input>

जवाब

एक ऑब्जेक्ट, जिसमें पहचाने गए टेक्स्ट की text कैटगरी होती है. ज़्यादा जानकारी के लिए, लेबल की पहचान करना देखें.

कॉन्फ़िगरेशन रेफ़रंस

एपीआई प्रॉक्सी में इस एक्सटेंशन को कॉन्फ़िगर और डिप्लॉय करते समय, यहां दी गई जानकारी का इस्तेमाल करें. Apigee कंसोल का इस्तेमाल करके, एक्सटेंशन को कॉन्फ़िगर करने के लिए, एक्सटेंशन जोड़ना और कॉन्फ़िगर करना देखें.

एक्सटेंशन की सामान्य प्रॉपर्टी

हर प्रॉपर्टी के लिए नीचे दी गई प्रॉपर्टी मौजूद हैं.

प्रॉपर्टी	जानकारी	डिफ़ॉल्ट	ज़रूरी है
`name`	वह नाम, जिसे आप एक्सटेंशन का यह कॉन्फ़िगरेशन दे रहे हैं.	कभी नहीं	हां
`packageName`	एक्सटेंशन पैकेज का नाम, जो Apigee Edge से दिया गया है.	कभी नहीं	हां
`version`	उस एक्सटेंशन पैकेज का वर्शन नंबर जिससे आपको एक्सटेंशन कॉन्फ़िगर करना है.	कभी नहीं	हां
`configuration`	आप जिस एक्सटेंशन को जोड़ रहे हैं उसके लिए खास तौर पर कॉन्फ़िगरेशन वैल्यू. इस एक्सटेंशन पैकेज के लिए प्रॉपर्टी देखें	कभी नहीं	हां