Google Cloud विज़न एक्सटेंशन

आपको Apigee Edge दस्तावेज़ दिख रहा है.
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है इस पेज पर जाएं Apigee X दस्तावेज़.
जानकारी

वर्शन: 1.4.1

मशीन लर्निंग मॉडल का इस्तेमाल करके, इमेज में मौजूद कॉन्टेंट और टेक्स्ट के बारे में जानें.

इस कॉन्टेंट में, इस एक्सटेंशन को कॉन्फ़िगर करने और इसका इस्तेमाल करने के बारे में जानकारी दी गई है. किसी API प्रॉक्सी से इस एक्सटेंशन का उपयोग करने से पहले, आपको यह करना होगा:

  1. अपने सेवा खाते के लिए, Cloud Vision API को चालू करें.

  2. इमेज के सोर्स के तौर पर Cloud Storage का इस्तेमाल करने पर, आपको इस एक्सटेंशन को Cloud Storage को ऐक्सेस करने की अनुमति भी देनी होगी. इसकी जानकारी, Google Cloud Storage एक्सटेंशन के रेफ़रंस में दी गई है.

  3. अगर आपके पास ऐसा सेवा खाता है जिसे Cloud Vision के लिए अनुमति मिली हुई है (और अगर Cloud Storage का इस्तेमाल किया जा रहा है, तो उस खाते के लिए), GCP कंसोल का इस्तेमाल करके सेवा खाते के लिए कुंजी जनरेट करें.

  4. कॉन्फ़िगरेशन रेफ़रंस का इस्तेमाल करके, एक्सटेंशन जोड़ते और कॉन्फ़िगर करते समय, नतीजे वाली कुंजी JSON फ़ाइल के कॉन्टेंट का इस्तेमाल करें.

Cloud Vision के बारे में जानकारी

Google Cloud Vision API, इमेज का विश्लेषण करने के लिए मशीन लर्निंग मॉडल का इस्तेमाल करता है. एपीआई के लिए, मॉडल को ट्रेनिंग दें या पहले से मौजूद मॉडल का इस्तेमाल करें.

पहले से मौजूद मॉडल का इस्तेमाल करके Cloud Vision, इमेज को "स्काईस्क्रेपर", सेलबोट", "लायन" या "कुतुब मीनार" जैसी कैटगरी में बांटता है. यह इमेज में मौजूद चीज़ों, चेहरों, लोगो, और लैंडमार्क का पता लगाता है और इमेज में मौजूद शब्दों को ढूंढता है.

सैंपल

नीचे दिए गए उदाहरणों में, एक्सटेंशन कॉलआउट नीति का इस्तेमाल करके, Cloud विज़न एक्सटेंशन कार्रवाइयों के लिए सहायता कॉन्फ़िगर करने का तरीका बताया गया है.

लेबल का पता लगाएं

नीचे दिए गए उदाहरण में, एक्सटेंशन की detectLabels कार्रवाई से इमेज image_uri पर मिलती है और विश्लेषण के लिए उसे Cloud Vision API में पास किया जाता है. एपीआई इमेज की जांच करेगा और तय करेगा कि इमेज के कॉन्टेंट पर कौनसे लेबल लागू होते हैं.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<ConnectorCallout async="false" continueOnError="true" enabled="true" name="Cloud-Vision-Extension">
    <DisplayName>Cloud Vision Extension</DisplayName>
    <Connector>cloud-vision-extension-example</Connector>
    <Action>detectLabels</Action>
    <Input><![CDATA[
    {
        "image_uri" : "gs://cloud-vision-example/empire-state-building.jpg"
    }
    ]]></Input>
    <Output>vision.labels.retrieved</Output>
</ConnectorCallout>

नीचे दी गई मैसेज असाइन करें नीति, रिस्पॉन्स पेलोड असाइन करने के लिए एक्सटेंशन के रिस्पॉन्स को स्टोर करने वाले वैरिएबल की वैल्यू का इस्तेमाल करती है.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<AssignMessage async="false" continueOnError="false" enabled="true" name="Get-Image-Labels">
    <DisplayName>Get Image Labels</DisplayName>
    <AssignTo type="response" createNew="false"/>
    <Set>
        <Payload contentType="application/json">{vision.labels.retrieved}</Payload>
    </Set>
</AssignMessage>

एक बहुत ऊंची इमारत वाले शहरी इलाके की इमेज को देखते हुए, आपको इस तरह की प्रतिक्रिया मिल सकती है:

{
  "labels": [
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "/m/0j_s4",
          "locale": "",
          "description": "metropolitan area",
          "score": 0.9868549704551697,
          "confidence": 0,
          "topicality": 0.9868549704551697,
          "boundingPoly": null
      },
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "/m/079cl",
          "locale": "",
          "description": "skyscraper",
          "score": 0.966157853603363,
          "confidence": 0,
          "topicality": 0.966157853603363,
          "boundingPoly": null
      }
  ]
}

टेक्स्ट का पता लगाएं

यहां दिए गए उदाहरण में, एक्सटेंशन detectText कार्रवाई से इमेज को image_uri पर लाया जाता है और विश्लेषण के लिए उसे Cloud Vision API में भेजा जाता है. एपीआई इमेज की जांच करेगा और इमेज में मौजूद टेक्स्ट की पहचान करेगा.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<ConnectorCallout async="false" continueOnError="true" enabled="true" name="Cloud-Vision-Text">
    <DisplayName>Cloud Vision Text</DisplayName>
    <Connector>cloud-vision-extension-example</Connector>
    <Action>detectText</Action>
    <Input><![CDATA[
    {
        "image_uri" : "gs://cloud-vision-example/parking-signs1.jpg"
    }
    ]]></Input>
    <Output>vision.text.retrieved</Output>
</ConnectorCallout>

नीचे दी गई मैसेज असाइन करें नीति, रिस्पॉन्स पेलोड असाइन करने के लिए एक्सटेंशन के रिस्पॉन्स को स्टोर करने वाले वैरिएबल की वैल्यू का इस्तेमाल करती है.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<AssignMessage async="false" continueOnError="false" enabled="true" name="Get-Image-Text">
    <DisplayName>Get Image Text</DisplayName>
    <AssignTo type="response" createNew="false"/>
    <Set>
        <Payload contentType="application/json">{vision.text.retrieved}</Payload>
    </Set>
</AssignMessage>

अगर किसी इमेज में पार्किंग लॉग में साइन मौजूद हैं, तो आपको इस तरह का जवाब मिल सकता है:

{
  "text": [
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "",
          "locale": "en",
          "description": "RESERVED\nVISITORPARKING\nPARKING\nONLY>\n$150 FINE\n",
          "score": 0,
          "confidence": 0,
          "topicality": 0,
          "boundingPoly": {
              "vertices": [
                  {
                      "x": 64,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 218
                  },
                  {
                      "x": 64,
                      "y": 218
                  }
              ]
          }
      },
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "",
          "locale": "",
          "description": "RESERVED",
          "score": 0,
          "confidence": 0,
          "topicality": 0,
          "boundingPoly": {
              "vertices": [
                  {
                      "x": 243,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 84
                  },
                  {
                      "x": 243,
                      "y": 84
                  }
              ]
          }
      }
   ]
}

कार्रवाइयां

detectLabels

यह बताई गई इमेज में मौजूद इकाइयों की जानकारी का पता लगाता है और उसे एक्सट्रैक्ट करता है. पहचानी गई इकाइयां, कई कैटगरी में मौजूद होती हैं. उदाहरण के लिए, इस कार्रवाई का इस्तेमाल चीज़ों, जगहों, गतिविधियों, जानवरों की प्रजातियों, प्रॉडक्ट वगैरह की पहचान करने के लिए करें.

साथ ही, Cloud Vision API से जुड़े दस्तावेज़ ज़रूर देखें.

अनुरोध के पैरामीटर

पैरामीटर ब्यौरा टाइप डिफ़ॉल्ट ज़रूरी है
image_uri इमेज का सोर्स. यह इंटरनेट या Google Cloud Storage (फ़ॉर्मैट: gs://bucketname/filename) से लिया जा सकता है. अगर सोर्स Google Cloud Storage है, तो इमेज फ़ाइल सार्वजनिक होनी चाहिए. स्ट्रिंग कोई नहीं. हां.

सिंटैक्स

<Input><![CDATA[{
    "image_uri" : "uri-of-image-to-analyze"
}
]]></Input>

उदाहरण

यहां दिए गए उदाहरण में, एक्सटेंशन की detectLabels कार्रवाई चुनी गई इमेज को विश्लेषण के लिए Vision API को भेजती है.

<Input><![CDATA[
{
    "image_uri" : "gs://cloud-vision-example/empire-state-building.jpg"
}
]]></Input>

जवाब

एक ऑब्जेक्ट जिसमें लेबल की labels कैटगरी शामिल है. यह इमेज में पहचानी गई इकाइयों को दिखाता है. ज़्यादा जानकारी के लिए, लेबल का पता लगाना लेख पढ़ें.

detectText

दी गई इमेज से टेक्स्ट की पहचान करता है और उसे निकालता है.

अनुरोध के पैरामीटर

पैरामीटर ब्यौरा टाइप डिफ़ॉल्ट ज़रूरी है
image_uri इमेज का सोर्स. यह इंटरनेट या Google Cloud Storage (फ़ॉर्मैट: gs://bucketname/filename) से लिया जा सकता है. अगर सोर्स Google Cloud Storage है, तो इमेज फ़ाइल सार्वजनिक होनी चाहिए. स्ट्रिंग कोई नहीं. हां.

सिंटैक्स

<Input><![CDATA[
{
    "image_uri" : "uri-of-image-to-analyze"
}
]]></Input>

उदाहरण

यहां दिए गए उदाहरण में, एक्सटेंशन की detectText कार्रवाई चुनी गई इमेज को विश्लेषण के लिए Vision API को भेजती है.

<Input><![CDATA[
{
    "image_uri" : "gs://cloud-vision-example/parking-signs1.jpg"
}
]]></Input>

जवाब

एक ऑब्जेक्ट, जिसमें पता लगाए गए टेक्स्ट की text कैटगरी है. ज़्यादा जानकारी के लिए, लेबल का पता लगाना लेख पढ़ें.

कॉन्फ़िगरेशन रेफ़रंस

एपीआई प्रॉक्सी में इस्तेमाल करने के लिए, इस एक्सटेंशन को कॉन्फ़िगर और डिप्लॉय करते समय, इनका इस्तेमाल करें. Apigee कंसोल का इस्तेमाल करके एक्सटेंशन को कॉन्फ़िगर करने का तरीका जानने के लिए, एक्सटेंशन जोड़ना और उसे कॉन्फ़िगर करना लेख पढ़ें.

सामान्य एक्सटेंशन प्रॉपर्टी

हर प्रॉपर्टी के लिए नीचे दी गई प्रॉपर्टी मौजूद हैं.

प्रॉपर्टी जानकारी डिफ़ॉल्ट ज़रूरी है
name वह नाम, जिसे आप एक्सटेंशन का यह कॉन्फ़िगरेशन दे रहे हैं. कभी नहीं हां
packageName एक्सटेंशन पैकेज का नाम, जो Apigee Edge से दिया गया है. कभी नहीं हां
version उस एक्सटेंशन पैकेज का वर्शन नंबर जिससे आपको एक्सटेंशन कॉन्फ़िगर करना है. कभी नहीं हां
configuration आप जिस एक्सटेंशन को जोड़ रहे हैं उसके लिए खास तौर पर कॉन्फ़िगरेशन वैल्यू. इस एक्सटेंशन पैकेज के लिए प्रॉपर्टी देखें कभी नहीं हां