برای دانلود اینجا را کلیک کنید
Download
Report
Transcript برای دانلود اینجا را کلیک کنید
1
بینایی ماشین ،تبدیل داده یک دوربین به یک نمایش جدید یا یک تصمیم است.
همه این تبدیالت براي رسیدن به هدف مشخص ی انجام میشود.
دادهي ورودي می تواند شامل اطالعات متنی مانند اینکه ”دوربین در یک ماشین
قرار داده شده ”یا این که” تشخیص دهندهي فاصله لیزري یک ش یءرا در
فاصله یک متري نشان می دهد“ ،باشد.
تصمیم نیز می تواند به طور مثال این باشد که ”شخص ی در صحنه حضور دارد
” یا این که ” 14سلول تومور در این اسالید وجود دارد” .یک نمایش جدید نیز
می تواند به معنی تبدیل یک تصویر رنگی به سیاه و سفید و یا حذف حر کت
دوربین از یک مجموعه تصاویر باشد.
2
3
ً
•ظاهر دوبعدي اشیاء می تواند شدیدا با
نقطه دید تغییر کند.
•داده ها همراه با نویز و اعوجاج میباشد.
4
چشم انسان تقریبا یک عدس ی
کروي با قطر 2.5سانتی متر
میباشد که از چندین الیه مختلف
که درونیترین آنها شبکیه نام دارد
تشکیل شده است .ماهیچههاي
اطراف چشم اندازه لنز را تنظیم
میکنند که این کار چشم را قادر به
زوم کردن روي اشیاء میکند.
5
CCD از جهت عملکرد تقریبا مانند چشم انسان کار میکند .نور از طریق یک
عدس ی وارد دوربین و برروي یک پرده مخصوص تصویر میشود که تحت عنوان
تراشه CCDشناخته میشود.
تعریف پیکسل :تراشه CCDکه تصاویر با استفاده از آن گرفته میشوند از
تعداد زیادي سلول تشکیل شده که همگی در یک تراشه با الگوي خاص ی مرتب
شدهاند و تحت عنوان پیکسل ( )pixelsشناخته میشوند.
6
خطاي چشم انسان و عادت كردن آن به كلمات باعث ميشود تا شما ،به
راحتي متن صفحه قبل را نیز بخوانيد!! با وجود اينكه پر از غلط امالئي
است!
7
در طراحي اين تصوير تماما از خطوط صاف و مستقيم استفاده شده
است.
8
9
10
11
12
13
چشم انسان قادر است كمتر از يك تريلينيوم درصد از امواج
الكترومغناطيس ي كه در اصطالح نور مرئي ميناميم را ببيند.
امواج رادیویی
امواج مایکرووی
مادون قرمز
امواج نوری
امواج ماوراء بنفش
اشعه ایکس
اشعه گاما
14
افزایش فرکانس
کاهش طول موج
15
دوربينهاي ديد در شب قادرند از انسانها و اشياء در شب فيلم برداري كرده و به
ما نشان دهند.
16
اندازه و ضخامت شبكيه به معادل يك تمبر پستي است.
چشم هشت پا بزرگترين چشم نسبت به جثه است.
پرندگان هشت برابر بهتر از انسان مي بينند.
چشم سنجاقك ده برابر بدتر از چشم انسان مي بيند.
چشم حشرات ده برابر بهتر از چشم انسان حركات را ميبيند .يك دويستم ثانيه
براي ديدن يك حركت براي آن كافي است.
همه چیز در زير آب به رنگ آبي مايل به سبز است زيرا آب طيف قرمز نور را
جذب ميكند.
احتماال“ سگها هيچ رنگي را نمي بينند البته اين موضوع هنوز ثابت نشده
است.
يك چشم سالم به طورمعمول میتواند ده ميليون رنگ را تشخيص دهد.
گاوها رنگ ها را نمي بينند پس پارچهي قرمز در عصباني كردن گاو وحش ي تاثیري
ندارد.
17
يك نمونه از خطاي ديد :اگر يك عينك وارونه كن بر چشم بگذاريم بعد از يك هفته
همه چیز درست ديده ميشود ولي اگر عينك را برداريم دوباره همه چیز به صورت
وارونه در ميآيد.
نور مهتاب كامل يك صدوشصتم نور خورشيد است.
جغد ميتواند در زير نور يك شمع در فاصله چهارصد متري طعمه اش را شكار كند.
چشم گربه سانان مانند آينه عمل ميكند و كمترين نورها را نیز بازتاب ميکند.
مار زنگي اشعه مادون قرمز را ميبيند بنابراين ،گرماي حاصل از بدن جانوران اين را به
سوي خود جذب ميكند.
خلبانان انگليس ي در جنگ جهاني دوم زياد هويج مي خوردند وقتي آملاني ها ديدند كه آن
ها هدف را در شب ميبينند فكر كردند كه اين اثر زياد خوردن هويج است در حالي كه
انگليس ي ها رادار را اختراع كرده بودند.
تصاوير متحرك براي چشم ما حداقل پانزده كادر در ثانيه هستند ولي اين مگس اين
تصاوير را به صورت صحنه آهسته مي بيند.
18
اولین كامپيوترها شامل سطرهاي بسياري از چراغها و كليدها بودند.
سپس دستگاههاي قابل برنامه نويس ي جديدي پديد آمد كه ميتوانستند بر روي لوله
كاغذ با مكانیزمي شبيه ماشین هاي تحرير از راه دور چاپ كنند.
مانيتورهاي CRTاوليه در آغاز تنها خروجي هايي براي تصاويري بودند كه تنها حروف
اسكي را نمايش میداد.
اولین گرافيك هاي كامپيوتري كه بر روي اين خروجي ها نمايش داده ميشد دو بعدی
بودند.
اصطالح Real-timeاولین بار به تصاويري كه متحرك بودند اطالق شد.
بكارگیري اصطالح Real-timeبراي گرافيك كامپيوتري بدين معناست كه كامپيوتر در
حال ارائه كردن يك انيميشن يا رشتهاي از تصاوير است كه بیدرنگ به بعض ي از
ورودي ها واكنش نشان ميدهد.
19
اصطالح سه بعدي ( :)3Dبه اين معناست كه يك ش ئ در حال نمايش ،سه بعد قابل
اندازهگیري دارد طول و عرض و عمق
گرافيك سه بعدي كامپيوتري در حقيقت تصاويري دو بعدي هستند روي يك صفحه
تخت كه بعد سوم و يا خطاي ديد در عمق را مهيا ميسازند.
2D + Perspective = 3D
پرسپكتيو تنها براي خلق سيماي سه بعدي كافي است.
مصنوعات سه بعدي :دليل اينكه وقتي شما جلوي يكي از چشمانتان را ميپوشانيد دنيا
به يكباره تخت نمیشود اين است كه هنوز افكتهاي سه بعدي زيادي حاظر هستند
وقتي كه دو بعدي تماشا ميشوند .اين افكتها (تاثیرات) به اندازهاي هستند كه باعث
شوند مغز شما به راحتي مسافت و عمق را تشخيص دهد .مسلم ترين چیز اينست كه
اشيا نزديكتر بزرگتر از اشيا دور نمايان ميشوند.
اين افكت پرسپكتيو Foreshorteningناميده ميشود .اين افكت و تغيیرات رنگ و
تكسچرها و نورها و اختالف در شدت رنگ همه با هم به ادراك ما يك تصوير سه
بعدي را اضافه ميكنند.
20
مهمترين ابزار خروجي كه مي تواند به مفهوم گرافيك كامپيوتري عينيت ببخشد ،صفحه
نمايش ( )Monitorاست كه امروزه با روشهاي متفاوت در اندازهها و كيفيتهاي
مختلفي توليد میشوند.
تعریف پیکسل ( :)Pixel=Picture cell/Elementدر معماري سختافزار گرافيك
كامپيوتري امروزي (و كارت هاي گرافيكي در راس آنها) تصاوير به صورت مجموعه اي از
نقاط در نظر گرفته مي شوند .هر نقطه ،رنگ و مشخصات خاص خود را دارد و
كوچكترين جز قابل رويت يك تصوير محسوب مي شود .به اين نقاط در اصطالح
پيكسل گفته میشود.
تعریف صفحه نمایش ( :)Screenبه مجموعه پيكسل هايي كه در هر لحظه از طريق
ابزارهايي مانند صفحه نمايش ترسيم مي شود صفحه تصوير گفته میشود.
صفحه نمايش دو بعدي در نظر گرفته مي شود و معموال پيكسل هايي كه در اين دو
بعد وجود دارند از طريق مختصات آنها مانند يك ماتريس قابل دسترس ي میباشند.
21
تفكيك پذيري (:)resolution
وضوح تصاوير يا تفكيك پذيري به مجموعه پيكسلهاي افقي و عمودي اطالق ميشود كه
صفحه نمايش قادر به نمايش آن است
پيكسل (:)pixel
پيكسل كوچكترين عنصر تصويري است كه به صورت نقطه كوچكي روي صفحه نمايش قابل
رويت ميباشد وبا توجه به تعداد و میزان تراكم اين نقاط در صفحه نمايش ،كيفيت
تصاوير به نمايش در آمده متفاوت خواهند بود.
ماتريس كاراكتر:
ماتريس كاراكتر مجموعه اي از نقاط روشن و خاموش در صفحه نمايش مي باشد كه يك
كاراكتر را نمايش مي دهند ،هر چه تعداد پيكسلهاي موجود در ماتريس كاراكتر بيشتر باشد،
وضوح تصاوير و كاراكترها نیز بيشتر خواهد بود.
مد متني (:)Text Mode
در اين مد كوچكترين جز تصوير كاراكتر است .صفحه نمايش به چند سطر و ستون تقسيم مي
شود .ابعاد صفحه در اين مد مي تواند 25*40یا 25*80باشد.
22
صفحه كريستال مايع (:)LCD
از اين نوع سابقا در كامپيوترهاي كيفي و قابل حمل استفاده مي شده و اكنون به صورت
رايج براي تمام كامپيوترها استفاده مي شود .اين صفحه نمايش حجم و وزن كمي دارد.
عبور يكسري جريانات خاص باعث نوراني شدن پيكسل هاي آن مي شود.
المپ اشعه كاتدي (:)CRT
اين نوع المپ تصوير ،كيفيت خوبي را ارائه ميدهد و حجم و توان مصرفي بااليي دارد .در
گذشته از اين نوع مانيتور براي كامپيوترهاي شخص ي استفاده ميشد .تفاوت عمده
تلويزيون با مانيتور در اين است كه تلويزيون داراي تيونر بوده و قادر است كانالهاي
مختلف تلويزيوني را از طريق آنتن دريافت كند.
23
نوع
ماتريس
كاراكتر
تفكيك پذيري
تعداد رنگ
توضيحات
MDA
9*14
گرافيك ندارد
تك رنگي
Monochrome
display adapter
CGA
۸*۸
200 *640
2۰۰*۳۲۰
رنگ4 تك رنگي
Color graphics
adapter
EGA
۸*۱٤
۶۴۰*۳٥۰
۳۲۰*۲۰۰
رنگ256 رنگ16
Enhanced
Graphics Adapter
VGA
۹*۱۶
۶۴۰*۴۸۰
۳۲۰*۲۰۰
رنگ256 رنگ16
Video Graphics
Array
HERCULES
-
٧۲۰*۳٥۰
تك رنگ
Monochrome
Graphics Adapter
MCGA
-
۶۴۰*۴۸۰
۳۲۰*۲۰۰
رنگ256 رنگ2
Multi color
graphics adapter
24
:MDAمتن را بدون لرزش و با دقت زياد به يكي از زبانهاي سبز ،خاكستري و سفيد
نمايش ميدهد.
:HERCULESاين كارت رنگي نيست ولي براي كارهاي گرافيكي ميتوان از آن
استفاده نمود.
:CGAمتن و گرافيك را با 4رنگ توليد ميكند .اين كارت مي تواند خروجي خود را
عالوه بر مانيتور به تلويزيون هم بدهد .هر چند در اين تعويض 80ستون در مانيتور به
40ستون در تلويزيون تبديل ميشود .
:EGAگرافيك و متن را خيلي خوب توليد ميكند و چهار حالت گرافيكي قابل نمايش
است.
:VGAاين كارت كليه چهار حالت گرافيكي EGAرا توليد ميكند و دقت آن براي
كارهاي اداري عالي و براي كارهاي چاپي و طراحي خوب است.
25
:تفاوت بین پردازش تصویر با بینایی ماشین
)Enhancement( بهبود
)Coding( کدگذاری
)Compression( فشرده سازی
)Restoration( ترمیم
)Reconstruction( بازسازی
)Measurement of features( اندازهگیری ویژگیها
)Pattern classification( طبقه بندی الگو
)Pattern recognition( الگو شناس ی
Image processing
Machine vision
26
اصطالحات بینایی کامپیوتر ( ،)computer visionدرک تصویر ( image
)understandingو آنالیز تصویر ( )image analysisاغلب مورد استفاده قرار
میگیرد که به معنای بینایی ماشین ( )machine visionمیباشد.
27
Raw
data
Feature
measurement
Feature
vector
Pattern
classifier
Class
identity
28
29
یک و یا چند دوربین دیجیتال یا آنالوگ (سیاه-سفید یا رنگی) با اپتیک مناسب
برای گرفتن عکس.
واسطه ای که عکسها را برای پردازش آماده میسازد .برای دوربینهای آنالوگ
این واسطه شامل یک دیجیتال کننده عکس است .هنگامی که این واسطه یک
سختافزار جدا باشد ،به آن ( Frame grabberکارتی که برای دریافت سیگنال
تصویری و فرستادن آن به کامپیوتر استفاده میشود) میگویند.
یک پردازشگر گاهی یک PCیا پردازنده تعبیه شده
مانند DSP
(Embedded
)Processor
نرمافزار Machine visionاین نرمافزار امکاناتی برای توسعه یک برنامه
نرمافزاری که برای کاربردی مشخص است را فراهم میکند.
30
سختافزار ورودی /خروجی (مثال I/Oدیجیتال) یا حلقههای ارتباطی مثال
ارتباط شبکه ای یا ( )RS-232برای گزارش نتایج.
یک دوربین هوشمند :یک وسیله ساده که همه موارد فوق را داراست.
لنزهایی که بتواند به مقدار مطلوبی روی سنسور تصویر زوم کند.
منابع نوری مناسب و گاهی خیلی مخصوص ( مثال چراغهای ،LEDفلورسنت،
المپهای هالوژن و ) . . .
یک برنامه مشخص که بتواند تصاویر را پردازش کرده و مشخصههای مربوط و
مناسب را شناسایی کند.
یک سنسور همزمان ساز برای شناسایی اجزا (گاهی یک سنسور نوری و یا یک
سنسور مغناطیس ی) :این سنسور برای راه اندازی سیستم استخراج و پردازش
تصویر میباشد.
31
سنسور همزمان ساز تعیین میکند که چه زمانی یک بخش (که معموال روی یک
حمل کننده حرکت می کند) در موقعیتی قرار گرفته است که باید مورد بررس ی
واقع شود .این سنسور هنگامیکه از زیر دوربین میگذرد و یک پالس نوری برای
ثابت نگهداشتن تصویر ایجاد میکند ،دوربین را برای گرفتن عکس فعال
میکند .نوری که برای روشن کردن آن بخش به کار می رود در واقع برای آن
است که مشخصههای مطلوب را برجسته و مشخصات نامطلوب (مثل سایهها
و یا انعکاسها) را به حداقل برساند .معموال پنلهای LEDبا اندازه و طراحی
مناسب برای این هدف مورد استفاده قرار می گیرند .تصویر دوربین یا توسط
یک frame grabberو یا توسط یک حافظه کامپیوتری (که در آن از frame
grabberاستفاده نشده است) گرفته میشود.
32
frame grabberیک وسیله دیجیتال کننده است (یا در داخل دوربین هوشمند و یا
بطور جداگانه) که خروجی دوربین را به فرمت دیجیتال تبدیل کرده (معموال این
فرمت از یک آرایه دو بعدی از اعداد تشکیل شده که هر عدد متناظر شدت
روشنایی نقطه متناظر در آن تصویر میباشد .به این نقاط پیکسل می گویند ).و
سپس تصویر را به منظور پردازش توسط نرمافزار Machine visionدر حافظه
کامپیوتر ذخیره میکند .به طور معمول نرمافزار ،اقدامات متفاوتی را برای
پردازش تصویر انجام میدهد .گاهی در ابتدا تصویر برای کاهش نویز و یا تبدیل
سایههای خاکستری به ترکیب ساده ای از رنگهای سیاه و سفید دستکاری
میشود ( )Binarizationدر قدم بعدی نرمافزار عمل شمردن ،اندازه گیری و
شناسایی اجسام ،ابعاد ،کاستیها و مشخصات دیگر تصویر را انجام می دهد.
33
در نهایت با توجه به ضوابط و معیارهای برنامه ریزی شده ممکن است بخش ی را
بپذیرد و یا رد کند .اگر یک بخش رد شد ،نرمافزار به یک دستگاه مکانیکی
فرمان می دهد تا آن بخش را خارج کند و همچنین سیستم خط تولید را قطع
کرده و به کارگر هشدار می دهد تا مشکلی که باعث ایجاد خطا شده را رفع
نماید .اگرچه اکثر Machine visionها بر مبنای دوربینهای سیاه–سفید بنا
نهاده شده اند ،استفاده از دوربینهای رنگی در حال رایج شدن است .همچنین
امروزه شاهد شیوع فراوان استفاده از تجهیزات دوربینهای دیجیتال به جای
یک دوربین و یک frame grabberجداگانه در Machine visionهستیم.
استفاده از یک دوربین دیجیتال به منظور برقراری ارتباط مستقیم ،باعث
صرفه جویی در هزینه و نیز سادگی سیستم خواهد شد .دوربینهای هوشمند که
در داخل آنها embedded processorها تعبیه شده اند ،در حال تسخیر سهم
باالیی از بازار Machine visionها هستند.
34
دوربینهای هوشمند که در داخل آنها embedded processorها تعبیه شدهاند ،در
حال تسخیر سهم باالیی از بازار Machine visionها هستند .استفاده از یک
embedded processorو یا یک پردازنده بهینه نیاز ما به frame grabberو یک
کامپیوتر خارجی را از بین میبرد .به همین خاطر این پردازندهها باعث کاهش
هزینه ،کاهش پیچیدگی سیستم و همچنین اختصاص توان پردازش ی مشخص به
هر دوربین میشود .دوربینهای هوشمند معموال ارزان تر از سیستمهای شامل
یک دوربین و یک برد و یک کامپیوتر خارجی هستند .همچنین توان باالی
embedded processorو DSPها منجر به باال رفتن عملکرد و توانایی آنها
نسبت به سیستمهای مرسوم ( که بر مبنای PCهستند) شده است.
35
تولید صنعتی در مقیاس بزرگ.
ساخت اجزایی که نیاز به زمان تولید مشخص ی دارند.
سیستمهای ایمنی موجود در محیطهای صنعتی.
بررس ی مواد اولیه تولید (مثال کنترل کیفیت و بررس ی وقوع خطا)
کنترل موجودی انبار و سیستمهای مدیریتی ( شمارش ،بارکد خواندن و ذخیره
اطالعات در سیستمهای دیجیتال)
کنترل رباتهای تعقیب خطی که برای حمل بار در کارخانههای صنعتی استفاده
می شوند.
کنترل کیفیت و بهبود محصوالت غذایی.
ماشینی کردن اجزای کوچک صنعتی.
36
شمارش پیکسل:
شمردن تعداد پیکسلهای روشن و تاریک.
تعیین آستانه:
تبدیل یک عکس با قسمتهای خاکستری به یک عکس سیاه و سفید به این طریق که با
قرار دادن آستانهای پیکسلهای روشن تر از آن را سفید و پیکسلهای تیرهتر از آن را
سیاه در نظر می گیریم.
بخشبندی کردن)Segmentation( :
تبدیل تصویر ورودی به بخشهای مختلف برای موقعیت یابی و شمارش پیکسلها.
تشخیص و شناسایی لکهها و دستکاری:
بررس ی یک عکس برای یافتن گسسته از بین تمامی پیکسلها( .به عنوان مثال یک حفره
سیاه رنگ در درون یک جسم خاکستری) این لکهها به عنوان نشان اختصاص ی عکس
خواهند بود.
37
تشخیص و شناسایی توسط اجزاء موجود:
استخراج اجزاءی خاص از یک تصویر ورودی مثال عکس.
تشخیص وشناسایی الگو به طور مداوم در برابر تغییرات:
به این معنا که موقعیت جسمی که ممکن است چرخانده شود یا اندازه اش تغییر کند یا
قسمتی از این جسم توسط جسم دیگر پوشانده شود ،را به طور دقیق شناسایی کند.
خواندن بارکد:
شناسایی و تعیین کدهای یک بعدی و دو بعدی اسکن شده توسط ماشینها طراحی شده
است.
تشخیص و شناسایی کاراکتر نوری:
خواندن خودکار یک متن (مثال :یک رشته اعداد پشت سرهم).
38
اندازه گیری:
اندازه گیری ابعاد یک جسم (بر حسب میلی متر یا اینچ).
تشخیص و شناسایی لبه ها:
پیدا کردن لبههای یک جسم در یک تصویر.
تشخیص و شناسایی از طریق تطبیق الگو:
پیدا کردن ،مطابقت دادن و شمارش اشکال خاص در یک تصویر.
در اکثرموارد یک سیستم Machine visionبه منظور بررس ی کامل یک تصویر ،از زنجیره
مرکبی از این تکنیکهای پردازش استفاده میکند .به عنوان مثال میتوان به سیستمی
اشاره کرد که بارکد را میخواند و هم سطح جسم را برای خراش احتمالی مورد بررس ی
قرار میدهد و هم ممکن است طول و عرض آن وسیله را اندازه گیری کند.
39
40
41
42
رنگ
مادون قرمز
طول موج (نانومتر)
فرکانس (تراهرتز)
انرژی (الکترون ولت)
باالتر از 1000
کمتر از 300
کمتر از 1/24
قرمز
700
428
1/77
نارنجی
زرد
620
484
2
580
517
2/14
سبز
530
566
2/34
آبی
470
638
2/64
بنفش
420
714
2/95
ماوراءبنفش
کمتر از 300
بیشتر ار 1000
بیشتر از 4/15
43
نمودار تابع به ازای مقادیر پیوسته و گسسته
44
برای یک پیکسل دو نوع همسایگی میتوان تعریف نمود:
همسایگی چهارگانه
همسایگی هشتگانه
شدت روشنایی پیکسل در سطر چهارم و ستون چهاردهم
45
شدت روشنایی دریافت شده توسط حسگر در پیکسل ( )m,nاز تصویر باید کوانتیزه شود.
در بینایی ماشین با دو نوع تصویر سروکار داریم:
تصویر باینری و تصویر خاکستری
تصویر سیاه و سفید
46
تصویر خاکستری
بازی تیس روی میز
47
بازی مشت زنی
48
از دید بینایی ماشین هریک از رنگهای قرمز و سبز و آبی یک
کانال رنگ نامیده میشود .یعنی برای ایجاد تصویر رنگی باید به
ازای هر پیکسل مقادیر هریک از کانالهای قرمز ،سبز و آبی را به
طور مجزا ذخیره نمود.
در بیشتر مسائل بینایی ماشین تصاویر رنگی را به خاکستری
طبق فرمول زیر تبدیل میکنند.
49
عملیات نقطهای از عملیات پیشپردازش میباشد که تنها بر روی
یک پیکسل از تصویر اعمال میگردد .با اعمال عملیات نقطهای
مقدار جدید یک پیکسل تنها تابعی از مقدار فعلی آن پیکسل
خواهد بود.
اگر عملیات نقطهای بر روی دو تصویر اعمال شوند ،مقدار جدید
پیکسل تابعی از مقادیر پیکسلهای متناظر در دو تصویر ورودی
خواهد بود.
50
51
فیلتر میانگین:
)1/(w*H
52
فیلتر گاوسین
فرمول فیلتر هموارکننده با استفاده از فیلتر گاوسین
53
فرمول هیستوگرام
نرمالیزه کردن هیستوگرام
54
به طورکلی تقطیع شامل چهار نوع عمل میباشد:
لبه یابی
آستانهگیری
تفکیک
یافتن نقاط بارز
55
56
فیلتر محاسبه مشتق
در جهت x
سوبل
سوبل تغییریافته
57
فیلتر محاسبه مشتق
در جهت y
-1
-2
-1
1
0
-1
0
0
0
2
0
-2
1
2
1
1
0
-1
3
10
3
-3
0
3
0
0
0
-10
0
10
-3
-10
-3
-3
0
3
فیلتر محاسبه مشتق
در جهت x
پرویت
روبرتز
58
فیلتر محاسبه مشتق
در جهت y
-1
-1
-1
1
0
-1
0
0
0
1
0
-1
1
1
1
1
0
-1
1
0
0
1
0
-1
-1
0
فیلترهای محاسبهی مشتق دوم تصویر
59
0
0
0
0
1
0
1
-2
1
0
-2
0
0
0
0
0
1
0
فیلتر الپالسین پایه
فیلتر الپالسین تغییر یافته
0
1
0
1
1
1
1
-4
1
1
-8
1
0
1
0
1
1
1
فیلتر سوبل
60
فیلتر الپالسین
61
62
63
64
65
66
67
68
69
با فرض وجود دو کالس (زمینه و پس زمینه) ،روش کلی اتسو مینیمم
کردن واریانس داخل کالسی میباشد .یعنی یافتن مقدار مینیمم رابطه
زیر:
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
5ش ی مجزا
94
16ش ی مجزا
95
برچسب زنی به روش پیمایش سطحی
برچسب زنی به روش پیمایش عمقی
برچسب زنی دو مرحلهای
96
برای پیادهسازی الگوریتم پیمایش گراف به صورت سطحی از یک صف استفاده
میکنیم.
ریشه را به صف اضافه کن و flagآن را ست کن
تا زمانی که صف خالی نشده است تکرار کن
گره سرصف را برداشته ،در خروجی چاپ کرده و همه فرزندان آن را که flagآنها ست نشده
باشد ،به انتهای صف اضافه کن
flagهمه گرههای فرزندان اضافه شده به صف را ست کن .ست کردن flagبدین منظور
انجام میگیرد که هر گره تنها یکبار به صف اضافه شود
97
ABCDEFGHIJ
98
برای پیاده سازی الگوریتم پیمایش گراف به صورت عمقی از یک پشته استفاده
میکنیم.
•
ریشه را به پشته اضافه کرده و فلگ آن را ست کن
تا زمانی که پشته خالی نشده است ،تکرار کن
•
گره باالی پشته را برداشته ( ،)Popآن را در خروجی چاپ کرده و همه فرزندان آن را که فلگ
آنها ست نشده باشد ،به پشته اضافه کن ()Push
فلگ همه گره های فرزندان اضافه شده به صف را ست کن .ست کردن فلگ بدین منظور
انجام می گیرد که هر گره تنها یکبار به صف اضافه شود.
•
•
99
ABFIGJHCDE
100
101
برچسب زنی به روش تکراری یک روش دو مرحله ای است که در مرحله اول با پیمایش تصویر از باال
به پایین و از چپ به راست به هر پیکسل ش ی ای ،بر اساس شرایط زیر برچسبی را انتساب می
دهد:
در همسایگی 4گانه پیکسل ) ،p(i,jاگر پیکسل باالیی ) p(i-1,jو پیکسل سمت چپی )p(i,j-1
دارای برچسب Xباشند ،پیکسل ) p(i,jنیز برچسب Xخواهد داشت.
در همسایگی 4گانه پیکسل ) ،p(i,jاگر پیکسل باالیی ) p(i-1,jیا پیکسل سمت چپی )p(i,j-1
دارای برچسب Xباشند ،پیکسل ) p(i,jنیز برچسب Xخواهد داشت.
در همسایگی 4گانه پیکسل ) ،p(i,jاگر پیکسل باالیی ) p(i-1,jبرچسب Xو پیکسل سمت
چپی ) p(i,j-1دارای برچسب Yباشند ( Xو Yباهم برابر نیستند) ،برچسب پیکسل ) p(i,jرا
برابر Xقرار داده و در جدول معادل ها Xو Yرا وارد می کنیم.
در همسایگی 4گانه پیکسل ) ،p(i,jاگر پیکسل باالیی ) p(i-1,jو پیکسل سمت چپی )p(i,j-1
هیچیک دارای برچسب نباشند ،به پیکسل ) p(i,jبرچسب جدیدی برابر Zقرار میدهیم.
102
هنگام انتساب برچسب به پیکسل ها معموال از مقادیر عددی استفاده می کنیم .جدول معادل
ها نیز شامل همه برچسب های معادل هم خواهد بود .در مرحله دوم برچسب های معادل با هم
ادغام شده و برچسب منحصربفردی را برای هریک از اشیا تولید میکند .اگر Xو Yدو
برچسب معادل از جدول معادلها باشند ،زمانی که X<Yباشد همه برچسب های Yرا
برابر Xقرار می دهیم و در نتیجه به هریک از اجزای متصل برچسب منحصربفردی منتسب می
شود.
103
104
مدل 16نقطهای نرما لیزه شده لب
105
مدل 16نقطهای لب
مدل هندس ی لب
106
تصویر شدت روشنایی اولیه
107
تصویر شدت روشنایی نرمالیزه شده
108
109
110
معیارهای مهم در آشکارسازی گوشه:
همه گوشه ها آشکار شوند.
هیچ گوشه اشتباهی یافت نشود.
نقاط گوشه پیدا شده باید در موقعیت درستی محلبایی شوند.
آشکاساز گوشه باید در مقابل نویز مقاوم باشد.
111
112
تصویر آغشته شده با نویز گوس ی
113
114
115
فضای پارامتری دایره پس از تبدیل هاف
116
117
118
الگوریتم تبدیل هاف دایرهای:
یافتن لبهها
برای هر نقطه لبه تبدیل هاف شروع میشود :یک دایره با مرکزیت نقطه لبه با شعاع rرسم
میشود و در انباره تمام مختصاتی که محیط دایره از آنها عبور میکند ،افزایش مییابند.
نقاط ماکزیمم در انباره پیدا میشود و تبدیل هاف تمام میشود.
پارامترهای پیدا شده ( )r,a,bمطابق با نقاط ماکزیمم روی تصویر اصلی مشخص میشوند.
119
استفاده از لبه یاب کنی
120
شکل اصلی
121
122
123
124
125
126
127
عملگر اجتماع
عملگر اشتراک
128
عملگر تفاضل
عملگر تک عملوندی مکمل
129
تصویر اصلی
حاصل گسترش تصویر
>> BW1 = imread('circbw.tif');
>> SE = strel('rectangle',[5 5]);
>> BW2 = imdilate(BW1,SE);
>> imshow(BW1),figure,imshow(BW2)
130
>> BW1 = imread('circbw.tif');
>> SE = strel('rectangle',[5 5]);
>> BW2 = imerode(BW1,SE);
>> imshow(BW1),figure,imshow(BW2)
131
132
>> BW1 = imread('circbw.tif');
>> BW2 = bwmorph(BW1,'skel',Inf);
>> imshow(BW1),figure, imshow(BW2)
133
134
135
پیدا کردن لبههای عمودی تصویر
هیستوگرام افقی تصویر لبههای عمودی
136
تصوير کانديد دوسطحی بدست آمده از
تصوير لبه
137
گسترش در جهت افقی و عمودی ،يافتن اشتراک
اين دو تصوير و گسترش در جهت افقی تصوير
اشتراک
پر کردن حفره های احتمالی
138
سايش تصوير و اعمال فيلتر ميانه
پيدا شدن محل پالک
139
هيستوگرام افقی متناظر
140
141
ویژگیهای شکل
ویژگیهای مبتنی بر ناحیه
ویژگیهای مبتنی بر شدت روشنایی
ویژگیهای مبتنی بر بانک فیلتر گابور
142
143
ویژگیهای تصویر از لحاظ نحوه توصیفگر به سه دسته تقسیم میگردد:
ویژگیهای عمومی یا سطح پایین (رنگ و بافت)
ویژگیهای معنایی
ِویژگیهای مختص کاربردهای خاص
144
انواع فضاهای رنگی در استخراج رنگ:
RGB
HSV
*L*a*b
145
روشهای استخراج رنگ:
ممان رنگ
هیستوگرام رنگ
هیستوگرام برچسب رنگ
بردار ارتباط رنگ
همبستگی نگاشت رنگ
رنگ غالب
بردار وابستگی
146
نمونهای از روشهای استخراج ویژگی بافت:
ماتریس Co-occurrence
ویژگی های Tamura
ویژگیهای فیلتر گابور
ویژگیهای تبدیل موجک
147
148
در این مثال از دو ویژگی رنگ غالب فازی و رنگ غالب فازی با در نظر گرفتن وابستگی مکانی پیکسل
ها استفاده شده است و ساختار مبتنی بر اتوماتای سلولی برای استخراج ویژگی بکار رفته است.
تابع عضویت وضعیت قرار گرفتن یک پیکسل در همسایگی 8از نطر رنگ پیکسلهای همسایه
149
نحوه نگاشت سلولهای اتوماتا بر پیکسلهای تصویر
150
151
طیف 8رنگ غلب
تابع عضویت 8رنگ غالب مورد استفاده برای دستهبندی پیکسلهای تصویر رنگی
152
153
154
155
156
157
الگوریتم کار:
محاسبه زاویه حرکت دست از روی نقاط پیدا شده
شناسایی حرکت مطلوب توسط سیستم فازی
قرار دادن نام حرکت روی نوار اتوماتا جهت تغییر وضعیت آن
شناسایی وضعیت نهایی اتوماتا و حرف نوشته شده
158
محاسبه زاویه حرکت دست:
159
نام حرکت
زاویه
جهات مهم حرکت دست
a
0
راست
b
45
راست-باال
c
90
باال
d
135
چپ-باال
e
180
چپ
f
-135
چپ-پایین
g
-90
پایین
h
-45
راست-پایین
160
فرمول یافتن مختصات جدید زاویه حرکت دست:
یافتن مکان کنونی دست با استفاده از لبهیابی:
مقادیر موجود در ماسک های Gx, Gyبرای لبه یابی تصویر در روش Sobel
161
مدل فازی تشخیص جهت حرکت دست از روی زاویه حرکت به دست آمده
جهت حرکت
162
سیستم فازی
زاویه
شناسایی
شده
ماشین های اتوماتای )DFA(Deterministic Finite Automata
یک DFAبه صورت
تعریف می شود ،که در آن:
Qیک مجموعه متناهی است که نام Stateهای ماشین در آن قرار دارد.
Ʃیک مجموعه متناهی است که نام Symbolهای زبان ماشین در آن قرار دارد.
δتابع انتقال (تغییر وضعیت) ماشین که به صورت تعریف می شود.
q0عضوی از می باشد که به عنوان Stateشروع می باشد.
Fزیر مجموعه ای از که به عنوان ( Stateهای) نهایی (پذیرش) می باشد.
163
گراف معادل اتوماتای طراحی شده برای شناسایی حروف A, M, N, Z
164