Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

תוסף Google Cloud Vision

אתם קוראים את מאמרי העזרה של Apigee Edge.
אפשר לעבור אל מסמכי התיעוד של Apigee X. מידע

גרסה: 1.4.1

איתור התוכן והטקסט בתמונות באמצעות מודלים של למידת מכונה.

התוכן הזה מספק הפניה להגדרת התוסף הזה ולשימוש בו. לפני שמשתמשים בתוסף הזה מתוך proxy ל-API, צריך:

מפעילים את Cloud Vision API בחשבון השירות.
אם אתם מתכוונים להשתמש ב-Cloud Storage כמקור התמונות, תצטרכו גם להעניק לתוסף הזה גישה ל-Cloud Storage, כמו שמתואר בהפניה לתוסף Google Cloud Storage.
אם יש לכם חשבון שירות עם הרשאה ל-Cloud Vision (ול-Cloud Storage, אם אתם משתמשים בו), אתם יכולים להשתמש במסוף GCP כדי ליצור מפתח לחשבון השירות.
משתמשים בתוכן של קובץ ה-JSON של המפתח שנוצר כשמוסיפים ומגדירים את התוסף באמצעות הפניה להגדרות.

מידע על Cloud Vision

‫Google Cloud Vision API משתמש במודלים של למידת מכונה כדי לנתח תמונות. אתם יכולים לאמן מודל לשימוש ב-API או להשתמש במודל המובנה.

באמצעות המודל המובנה, Cloud Vision מסווג תמונות לקטגוריות כמו 'גורד שחקים', 'סירת מפרש', 'אריה' או 'מגדל אייפל'. הוא מזהה אובייקטים, פנים, סמלי לוגו וציוני דרך בתמונות, ומאתר מילים שמופיעות בתמונות.

דוגמאות

בדוגמאות הבאות אפשר לראות איך מגדירים תמיכה בפעולות של תוסף Cloud Vision באמצעות מדיניות ExtensionCallout.

זיהוי תוויות

בדוגמה הבאה, הפעולה detectLabels של התוסף מקבלת את התמונה ב-image_uri ומעבירה אותה ל-Cloud Vision API לצורך ניתוח. ממשק ה-API יבדוק את התמונה ויקבע אילו תוויות רלוונטיות לתוכן שלה.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<ConnectorCallout async="false" continueOnError="true" enabled="true" name="Cloud-Vision-Extension">
    <DisplayName>Cloud Vision Extension</DisplayName>
    <Connector>cloud-vision-extension-example</Connector>
    <Action>detectLabels</Action>
    <Input><![CDATA[
    {
        "image_uri" : "gs://cloud-vision-example/empire-state-building.jpg"
    }
    ]]></Input>
    <Output>vision.labels.retrieved</Output>
</ConnectorCallout>

מדיניות הקצאת הודעה הבאה משתמשת בערך של המשתנה שמאחסן את התגובה של התוסף כדי להקצות את מטען התגובה.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<AssignMessage async="false" continueOnError="false" enabled="true" name="Get-Image-Labels">
    <DisplayName>Get Image Labels</DisplayName>
    <AssignTo type="response" createNew="false"/>
    <Set>
        <Payload contentType="application/json">{vision.labels.retrieved}</Payload>
    </Set>
</AssignMessage>

אם תבקשו תמונה של אזור עירוני עם בניין גבוה מאוד, יכול להיות שתקבלו תגובה כמו זו:

{
  "labels": [
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "/m/0j_s4",
          "locale": "",
          "description": "metropolitan area",
          "score": 0.9868549704551697,
          "confidence": 0,
          "topicality": 0.9868549704551697,
          "boundingPoly": null
      },
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "/m/079cl",
          "locale": "",
          "description": "skyscraper",
          "score": 0.966157853603363,
          "confidence": 0,
          "topicality": 0.966157853603363,
          "boundingPoly": null
      }
  ]
}

זיהוי טקסט

בדוגמה הבאה, הפעולה detectText של התוסף מקבלת את התמונה ב-image_uri ומעבירה אותה ל-Cloud Vision API לצורך ניתוח. ה-API יבדוק את התמונה ויזהה את הטקסט שמופיע בה.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<ConnectorCallout async="false" continueOnError="true" enabled="true" name="Cloud-Vision-Text">
    <DisplayName>Cloud Vision Text</DisplayName>
    <Connector>cloud-vision-extension-example</Connector>
    <Action>detectText</Action>
    <Input><![CDATA[
    {
        "image_uri" : "gs://cloud-vision-example/parking-signs1.jpg"
    }
    ]]></Input>
    <Output>vision.text.retrieved</Output>
</ConnectorCallout>

מדיניות הקצאת הודעה הבאה משתמשת בערך של המשתנה שמאחסן את התגובה של התוסף כדי להקצות את מטען התגובה.

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<AssignMessage async="false" continueOnError="false" enabled="true" name="Get-Image-Text">
    <DisplayName>Get Image Text</DisplayName>
    <AssignTo type="response" createNew="false"/>
    <Set>
        <Payload contentType="application/json">{vision.text.retrieved}</Payload>
    </Set>
</AssignMessage>

אם תשלחו תמונה עם שלטים בחניון, יכול להיות שתקבלו תשובה כמו זו:

{
  "text": [
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "",
          "locale": "en",
          "description": "RESERVED\nVISITORPARKING\nPARKING\nONLY>\n$150 FINE\n",
          "score": 0,
          "confidence": 0,
          "topicality": 0,
          "boundingPoly": {
              "vertices": [
                  {
                      "x": 64,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 218
                  },
                  {
                      "x": 64,
                      "y": 218
                  }
              ]
          }
      },
      {
          "locations": [

          ],
          "properties": [

          ],
          "mid": "",
          "locale": "",
          "description": "RESERVED",
          "score": 0,
          "confidence": 0,
          "topicality": 0,
          "boundingPoly": {
              "vertices": [
                  {
                      "x": 243,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 56
                  },
                  {
                      "x": 378,
                      "y": 84
                  },
                  {
                      "x": 243,
                      "y": 84
                  }
              ]
          }
      }
   ]
}

פעולות

detectLabels

מזהה ומחלץ מידע על ישויות בתמונה שצוינה. הישויות שאותרו משתייכות למגוון רחב של קטגוריות. לדוגמה, אפשר להשתמש בפעולה הזו כדי לזהות אובייקטים, מיקומים, פעילויות, מיני בעלי חיים, מוצרים ועוד.

מומלץ גם לעיין בתיעוד של Cloud Vision API.

פרמטרים של בקשה

פרמטר	תיאור	סוג	ברירת מחדל	חובה
image_uri	מקור התמונה. התמונה יכולה להיות מהאינטרנט או מ-Google Cloud Storage (בפורמט `gs://bucketname/filename`). אם המקור הוא Google Cloud Storage, קובץ התמונה צריך להיות ציבורי.	מחרוזת	ללא.	כן.

תחביר

<Input><![CDATA[{
    "image_uri" : "uri-of-image-to-analyze"
}
]]></Input>

דוגמה

בדוגמה הבאה, הפעולה detectLabels של התוסף שולחת את התמונה שצוינה ל-Vision API לצורך ניתוח.

<Input><![CDATA[
{
    "image_uri" : "gs://cloud-vision-example/empire-state-building.jpg"
}
]]></Input>

תשובה

אובייקט שמכיל labels מערך של תוויות שמייצגות ישויות שזוהו בתמונה. מידע נוסף זמין במאמר בנושא זיהוי תוויות.

detectText

מזהה ומחלץ טקסט מהתמונה שצוינה.

פרמטרים של בקשה

פרמטר	תיאור	סוג	ברירת מחדל	חובה
image_uri	מקור התמונה. התמונה יכולה להיות מהאינטרנט או מ-Google Cloud Storage (בפורמט `gs://bucketname/filename`). אם המקור הוא Google Cloud Storage, קובץ התמונה צריך להיות ציבורי.	מחרוזת	ללא.	כן.

תחביר

<Input><![CDATA[
{
    "image_uri" : "uri-of-image-to-analyze"
}
]]></Input>

דוגמה

בדוגמה הבאה, הפעולה detectText של התוסף שולחת את התמונה שצוינה ל-Vision API לצורך ניתוח.

<Input><![CDATA[
{
    "image_uri" : "gs://cloud-vision-example/parking-signs1.jpg"
}
]]></Input>

תשובה

אובייקט שמכיל מערך text של הטקסט שזוהה. מידע נוסף זמין במאמר בנושא זיהוי תוויות.

הסבר על ההגדרות

כשמגדירים ופורסים את התוסף הזה לשימוש בשרתי proxy ל-API, צריך להשתמש בהגדרות הבאות. הוראות להגדרת תוסף באמצעות מסוף Apigee מפורטות במאמר הוספה והגדרה של תוסף.

מאפיינים נפוצים של תוספים

המאפיינים הבאים קיימים בכל תוסף.

נכס	תיאור	ברירת המחדל	נדרש
`name`	השם שבחרת לתצורה הזו של התוסף.	ללא	כן
`packageName`	השם של חבילת התוסף כפי שהוא סופק על ידי Apigee Edge.	ללא	כן
`version`	מספר הגרסה של חבילת התוסף שממנה מגדירים את התוסף.	ללא	כן
`configuration`	ערך הגדרה ספציפי לתוסף שרוצים להוסיף. מאפיינים לחבילת תוספים זו	ללא	כן