আপনি Apigee Edge-এর ডকুমেন্টেশন দেখছেন।
Apigee X ডকুমেন্টেশন .info- তে যান।
সংস্করণ: ১.৪.১
মেশিন লার্নিং মডেল ব্যবহার করে ছবির বিষয়বস্তু ও লেখা শনাক্ত করুন।
এই বিষয়বস্তুতে এই এক্সটেনশনটি কনফিগার এবং ব্যবহার করার জন্য নির্দেশিকা দেওয়া হয়েছে। একটি এপিআই প্রক্সি থেকে এই এক্সটেনশনটি ব্যবহার করার আগে, আপনাকে অবশ্যই:
আপনার পরিষেবা অ্যাকাউন্টের জন্য ক্লাউড ভিশন এপিআই সক্রিয় করুন ।
আপনি যদি আপনার ছবিগুলোর উৎস হিসেবে ক্লাউড স্টোরেজ ব্যবহার করেন, তাহলে গুগল ক্লাউড স্টোরেজ এক্সটেনশন রেফারেন্সে বর্ণিত পদ্ধতি অনুযায়ী এই এক্সটেনশনটিকেও ক্লাউড স্টোরেজে অ্যাক্সেস দিতে হবে।
আপনার যদি ক্লাউড ভিশন (এবং ক্লাউড স্টোরেজ, যদি আপনি এটি ব্যবহার করেন) ব্যবহারের অনুমতিসহ একটি সার্ভিস অ্যাকাউন্ট থাকে, তাহলে সেই সার্ভিস অ্যাকাউন্টের জন্য একটি কী তৈরি করতে GCP কনসোল ব্যবহার করুন ।
কনফিগারেশন রেফারেন্স ব্যবহার করে এক্সটেনশনটি যোগ ও কনফিগার করার সময়, প্রাপ্ত কী JSON ফাইলের বিষয়বস্তু ব্যবহার করুন।
ক্লাউড ভিশন সম্পর্কে
গুগল ক্লাউড ভিশন এপিআই ছবি বিশ্লেষণ করার জন্য মেশিন লার্নিং মডেল ব্যবহার করে। আপনি এপিআই ব্যবহারের জন্য একটি মডেলকে প্রশিক্ষণ দিতে পারেন অথবা এর অন্তর্নির্মিত মডেলটি ব্যবহার করতে পারেন ।
অন্তর্নির্মিত মডেল ব্যবহার করে, ক্লাউড ভিশন ছবিগুলোকে 'গগনচুম্বী অট্টালিকা', 'পালতোলা নৌকা', 'সিংহ' বা 'আইফেল টাওয়ার'-এর মতো বিভিন্ন শ্রেণীতে ভাগ করে। এটি ছবির মধ্যে থাকা বস্তু, মুখমণ্ডল, লোগো এবং ল্যান্ডমার্ক শনাক্ত করে এবং ছবির ভেতরে থাকা শব্দগুলোর অবস্থান নির্ণয় করে।
নমুনা
নিম্নলিখিত উদাহরণগুলিতে ExtensionCallout পলিসি ব্যবহার করে ক্লাউড ভিশন এক্সটেনশন অ্যাকশনের জন্য সাপোর্ট কীভাবে কনফিগার করতে হয় তা দেখানো হয়েছে।
লেবেল সনাক্ত করুন
নিম্নলিখিত উদাহরণে, এক্সটেনশনটির detectLabels অ্যাকশনটি image_uri থেকে ছবিটি সংগ্রহ করে এবং বিশ্লেষণের জন্য ক্লাউড ভিশন এপিআই-তে পাঠায়। এপিআইটি ছবিটি পরীক্ষা করে নির্ধারণ করবে যে এর বিষয়বস্তুর জন্য কোন লেবেলগুলো প্রযোজ্য।
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<ConnectorCallout async="false" continueOnError="true" enabled="true" name="Cloud-Vision-Extension">
<DisplayName>Cloud Vision Extension</DisplayName>
<Connector>cloud-vision-extension-example</Connector>
<Action>detectLabels</Action>
<Input><![CDATA[
{
"image_uri" : "gs://cloud-vision-example/empire-state-building.jpg"
}
]]></Input>
<Output>vision.labels.retrieved</Output>
</ConnectorCallout>
নিম্নলিখিত অ্যাসাইন মেসেজ পলিসিটি এক্সটেনশনের প্রতিক্রিয়া সংরক্ষণকারী ভেরিয়েবলের মান ব্যবহার করে রেসপন্স পেলোড নির্ধারণ করে।
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<AssignMessage async="false" continueOnError="false" enabled="true" name="Get-Image-Labels">
<DisplayName>Get Image Labels</DisplayName>
<AssignTo type="response" createNew="false"/>
<Set>
<Payload contentType="application/json">{vision.labels.retrieved}</Payload>
</Set>
</AssignMessage>
একটি খুব উঁচু ভবনসহ কোনো শহরাঞ্চলের ছবি দেওয়া হলে, আপনি নিম্নলিখিত ধরনের একটি প্রতিক্রিয়া পেতে পারেন:
{
"labels": [
{
"locations": [
],
"properties": [
],
"mid": "/m/0j_s4",
"locale": "",
"description": "metropolitan area",
"score": 0.9868549704551697,
"confidence": 0,
"topicality": 0.9868549704551697,
"boundingPoly": null
},
{
"locations": [
],
"properties": [
],
"mid": "/m/079cl",
"locale": "",
"description": "skyscraper",
"score": 0.966157853603363,
"confidence": 0,
"topicality": 0.966157853603363,
"boundingPoly": null
}
]
}
পাঠ্য সনাক্ত করুন
নিম্নলিখিত উদাহরণে, এক্সটেনশনের detectText অ্যাকশনটি image_uri থেকে ছবিটি সংগ্রহ করে এবং বিশ্লেষণের জন্য ক্লাউড ভিশন এপিআই-তে পাঠায়। এপিআইটি ছবিটি পরীক্ষা করে এর মধ্যে থাকা লেখা শনাক্ত করবে।
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<ConnectorCallout async="false" continueOnError="true" enabled="true" name="Cloud-Vision-Text">
<DisplayName>Cloud Vision Text</DisplayName>
<Connector>cloud-vision-extension-example</Connector>
<Action>detectText</Action>
<Input><![CDATA[
{
"image_uri" : "gs://cloud-vision-example/parking-signs1.jpg"
}
]]></Input>
<Output>vision.text.retrieved</Output>
</ConnectorCallout>
নিম্নলিখিত অ্যাসাইন মেসেজ পলিসিটি এক্সটেনশনের প্রতিক্রিয়া সংরক্ষণকারী ভেরিয়েবলের মান ব্যবহার করে রেসপন্স পেলোড নির্ধারণ করে।
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<AssignMessage async="false" continueOnError="false" enabled="true" name="Get-Image-Text">
<DisplayName>Get Image Text</DisplayName>
<AssignTo type="response" createNew="false"/>
<Set>
<Payload contentType="application/json">{vision.text.retrieved}</Payload>
</Set>
</AssignMessage>
পার্কিং লগে থাকা চিহ্ন সম্বলিত একটি ছবি দেওয়া হলে, আপনি নিম্নলিখিতের মতো একটি প্রতিক্রিয়া পেতে পারেন:
{
"text": [
{
"locations": [
],
"properties": [
],
"mid": "",
"locale": "en",
"description": "RESERVED\nVISITORPARKING\nPARKING\nONLY>\n$150 FINE\n",
"score": 0,
"confidence": 0,
"topicality": 0,
"boundingPoly": {
"vertices": [
{
"x": 64,
"y": 56
},
{
"x": 378,
"y": 56
},
{
"x": 378,
"y": 218
},
{
"x": 64,
"y": 218
}
]
}
},
{
"locations": [
],
"properties": [
],
"mid": "",
"locale": "",
"description": "RESERVED",
"score": 0,
"confidence": 0,
"topicality": 0,
"boundingPoly": {
"vertices": [
{
"x": 243,
"y": 56
},
{
"x": 378,
"y": 56
},
{
"x": 378,
"y": 84
},
{
"x": 243,
"y": 84
}
]
}
}
]
}
কর্ম
লেবেল সনাক্ত করুন
নির্দিষ্ট ছবির মধ্যে থাকা সত্তাগুলো শনাক্ত করে এবং সেগুলোর তথ্য সংগ্রহ করে। শনাক্তকৃত সত্তাগুলো বিভিন্ন বিস্তৃত বিভাগের অন্তর্ভুক্ত। উদাহরণস্বরূপ, বস্তু, স্থান, কার্যকলাপ, প্রাণীর প্রজাতি, পণ্য এবং আরও অনেক কিছু শনাক্ত করতে এই অ্যাকশনটি ব্যবহার করুন।
এছাড়াও, ক্লাউড ভিশন এপিআই ডকুমেন্টেশনটি অবশ্যই দেখে নেবেন।
অনুরোধের পরামিতি
| প্যারামিটার | বর্ণনা | প্রকার | ডিফল্ট | প্রয়োজনীয় |
|---|---|---|---|---|
| image_uri | ছবির উৎস। এটি ইন্টারনেট অথবা গুগল ক্লাউড স্টোরেজ থেকে হতে পারে (ফর্ম্যাট: gs://bucketname/filename )। উৎস গুগল ক্লাউড স্টোরেজ হলে, ছবির ফাইলটি অবশ্যই পাবলিক হতে হবে। | স্ট্রিং | কিছুই না। | হ্যাঁ। |
সিনট্যাক্স
<Input><![CDATA[{
"image_uri" : "uri-of-image-to-analyze"
}
]]></Input>
উদাহরণ
নিম্নলিখিত উদাহরণে, এক্সটেনশনটির detectLabels অ্যাকশনটি নির্দিষ্ট ছবিটি বিশ্লেষণের জন্য ভিশন এপিআই-তে পাঠায়।
<Input><![CDATA[
{
"image_uri" : "gs://cloud-vision-example/empire-state-building.jpg"
}
]]></Input>
প্রতিক্রিয়া
একটি অবজেক্ট, যাতে ছবির মধ্যে শনাক্ত করা সত্তাগুলোর প্রতিনিধিত্বকারী labels একটি অ্যারে থাকে। আরও জানতে, ‘লেবেল শনাক্তকরণ’ দেখুন।
detectText
নির্দিষ্ট ছবি থেকে লেখা শনাক্ত ও নিষ্কাশন করে।
অনুরোধের পরামিতি
| প্যারামিটার | বর্ণনা | প্রকার | ডিফল্ট | প্রয়োজনীয় |
|---|---|---|---|---|
| image_uri | ছবির উৎস। এটি ইন্টারনেট অথবা গুগল ক্লাউড স্টোরেজ থেকে হতে পারে (ফর্ম্যাট: gs://bucketname/filename )। উৎস গুগল ক্লাউড স্টোরেজ হলে, ছবির ফাইলটি অবশ্যই পাবলিক হতে হবে। | স্ট্রিং | কিছুই না। | হ্যাঁ। |
সিনট্যাক্স
<Input><![CDATA[
{
"image_uri" : "uri-of-image-to-analyze"
}
]]></Input>
উদাহরণ
নিম্নলিখিত উদাহরণে, এক্সটেনশনটির detectText অ্যাকশনটি নির্দিষ্ট ছবিটি বিশ্লেষণের জন্য ভিশন এপিআই-তে পাঠায়।
<Input><![CDATA[
{
"image_uri" : "gs://cloud-vision-example/parking-signs1.jpg"
}
]]></Input>
প্রতিক্রিয়া
শনাক্তকৃত টেক্সটের একটি text অ্যারে ধারণকারী একটি অবজেক্ট। আরও জানতে, লেবেল শনাক্তকরণ দেখুন।
কনফিগারেশন রেফারেন্স
এপিআই প্রক্সিতে ব্যবহারের জন্য এই এক্সটেনশনটি কনফিগার এবং ডেপ্লয় করার সময় নিম্নলিখিত বিষয়গুলো ব্যবহার করুন। Apigee কনসোল ব্যবহার করে একটি এক্সটেনশন কনফিগার করার ধাপগুলোর জন্য, “একটি এক্সটেনশন যোগ করা এবং কনফিগার করা” দেখুন।
সাধারণ সম্প্রসারণ বৈশিষ্ট্য
নিম্নলিখিত বৈশিষ্ট্যগুলি প্রতিটি এক্সটেনশনের জন্য উপস্থিত রয়েছে।
| সম্পত্তি | বর্ণনা | ডিফল্ট | প্রয়োজন |
|---|---|---|---|
name | আপনি এক্সটেনশনের এই কনফিগারেশনের নাম দিন। | কোনোটিই নয় | হ্যাঁ |
packageName | Apigee Edge দ্বারা প্রদত্ত এক্সটেনশন প্যাকেজের নাম। | কোনোটিই নয় | হ্যাঁ |
version | যে এক্সটেনশন প্যাকেজ থেকে আপনি একটি এক্সটেনশন কনফিগার করছেন তার সংস্করণ নম্বর। | কোনোটিই নয় | হ্যাঁ |
configuration | আপনি যে এক্সটেনশনটি যোগ করছেন তার জন্য নির্দিষ্ট কনফিগারেশন মান। এই এক্সটেনশন প্যাকেজের বৈশিষ্ট্য দেখুন | কোনোটিই নয় | হ্যাঁ |