نوشته هایی که درمورد ’ توضیحانه ’ هستند

عکس روز: احضار روح ِ تضمینی بصورت دیجیتالی

nikon_s60_3_s.jpg

Turk و Pentland زوج مشهوری هستند که تئوری “صورت ویژه”  Eigenface* را برای تشخیص چهره در تصویر در یک مقاله در سال ۱۹۹۱ کاربردی کردند. دقیقا نمی دانم که دوربین هایی نظیر Nikon S60 که تبلیغش را این بالا می بینید از چه روشی استفاده می کنند، اما کارهایی مثل بهبود چهره در تصویر، پس از تشخیص آن، حالا دیگر کاملا کاربردی شده اند. در این تبلیغ Nikon ادعا می کند که دوربینش تا ۱۲ چهره را در تصویر پیدا می کند، و البته نه فقط چهره ی آدمهای زنده را.

به گفته ی این وبلاگ نویس خریداران در آمازون از این دوربین ۳۰۰ دلاری راضی نیستند.

این هم یک تبلیغ دیگر از همین دوربین.

nikon_s60_2s.jpg

* کارهایی روی “چشم ویژه” و “لب ویژه” هم وجود دارند.

عکس از اینجا

توضیحانه: رابینسون کروزوئه نقاش می شود

این “توضیحانه” در مورد این پست دکتر مجیدی عزیز است: روند تدریجی تکامل را در یک عکس تجربه کنید.

الگوریتم ارایه شده در این صفحه یک تصویر را به کمک روی هم گذاشتن ۵۰ شش ضلعی (؟) ِ شفاف Transparent بازسازی می کند. برای حل این مساله، که اساسا یک مساله ی بهینه سازی دشوار است، از الگوریتم ژنتیک استفاده می شود.

ga_image.jpg

بطور خلاصه، در یک الگوریتم ژنتیک، “راه حل” بصورت یک کروموزوم کد می شود که از تعدادی ژن تشکیل شده است. در مساله ی ما، گوشه های چندضلعی ها، رنگ آنها، و میزان شفافیت آنها، ژنهای مساله هستند (بنظر می رسد از شش ضلعی استفاده شده است). با فشردن Export DNA این ساختار را ببینید.

طبق توضیح صفحه، در هر “نسل” یک ژن بطور تصادفی تغییر می کند و اگر این تغییر “مناسب” بود حفظ می شود. به همین دلیل شما evolving یعنی موجود فعلی  و best  یعنی بهترین موجود تاحال را می بینید. تعریف “بهترین” در این مساله “شبیه ترین به تصویر داده شده به لحاظ پیکسلی” است.

الگوریتم ارایه شده در عمل تنها از جهش mutation تک ژنی استفاده میکند و از ابزار اساسی crossover (آمیخته شدن ژنهای پدر و مادر و تولید بچه) استفاده ای نمی برد. به عبارت ساده تر، آقای رابینسون کروزوئه مشغول تولید مثل با حضرت خودش است و منتظر است که موجود برتری از این روند پدیدار شود.

الگوریتم نوشته شده همینطور به شدت خشن است و بنظر می رسد تنها بهترین بچه را حفظ می کند. در عمل مناسب است که بچه های “نسبتا خوب” هم شانس زندگی داشته باشند. با اینحال، کد نوشته شده نمایش تصویری بسیار جالبی از نحوه ی عمل یک الگوریتم ژنتیک ارایه می دهد.

توضیحانه: از دستکاری تصویر بپرهیزید

javad_moghimi_2.jpgاین اولین پست از مجموعه ی “توضیحانه” است. هدف ِ این مجموعه نگاه کمی فنی تر به پستهایی است که در وبلاگ ها می بینیم. “توضیحانه” هایی که در حیطه ی تخصص من باشند قاعدتا به پردازش تصویر، بهینه سازی و کمی هم طراحی شبکه های سلولی مرتبط هستند.

جواد خان منتظری امروز پستی نوشته بود به این مضمون که عکاس خبرگزاری فارس تصویری را سانسور کرده است،

لکه سیاه در واقع بخشی از عکس است که در عکس واقعی وجود نداشته و بعد در فوتوشاپ اضافه شده به این هدف که فرم چادر در داخل عکس با هم آنقدر جور شود که یک عکس گرافیکی را پدید آورد. حالا نمی دانم که در آن بخش چی بوده که خواستن سیاهش کنن، شاید هم بدن آن زن پیدا بوده، نمی دانم راستش اگه قراره که عکس یک عکاس با افزودن یه چیزایی در فوتوشاپ و یا دستکاری های خارج از اصول اخلاقی عکس خوب بشه، فکر می کنم که آدم دوربین رو کنار بزاره بهتره

روشی که جناب منتظری برای تشخیص دستکاری بکار گرفته است به نام های مختلفی شناخته می شود، از جمله Tamper Detection. دلیل اساسی موفقیت این روش ها در این است که ما هرگز سیگنال های اطلاعاتی، از جمله تصویر، صوت، و ویدئو، را در حجم کاملشان ذخیره نمی کنیم (بدلیل حجم بالا و افزونگی redundancy شدید این سیگنال ها).

در مورد تصاویر، هنوز استاندارد ِ بسیار پرکاربرد Jpeg استفاده می شود (و نه Jpeg2000). این استاندارد مبتنی بر فشرده سازی بلوکهای ۸ در ۸ تصویر به کمک تبدیل DCT است. بطور خلاصه، اساسا می شود تصور کرد که ۲۵۶ به توان ۶۴ بلوک ۸ در ۸ در دنیا وجود دارند. در استاندارد Jpeg اما، ما این بلوکها را ساده سازی می کنیم و از تعدادشان کم می کنیم. به عبارت ساده تر، هر ۸ در ۸ی قابلیت وجود داشتن در یک تصویر Jpeg شده را ندارد.

این یعنی آقای فارس نیوز که تصویر را دست کاری می کند، لاجرم نظم موجود را بهم می زند و آقای منتظری مچش را می گیرد.

روشهای فنی ِ بسیار پیچیده ای برای محافظت از تصاویر دربرابر دستکاری وجود دارند. روش آقای منتظری “کور” است، یعنی بدون دیدن نمونه ی اصلی مچ دستکاری کننده را می گیرد. روشهایی هم وجود دارند که مبتنی بر گذاشتن یک “قفل شکننده” روی تصویر هستند. به این ترتیب، هر دستکاری نامتعارفی، مثلا جز فشرده سازی، باعث شکسته شدن قفل و برملا شدن دستکاری می شود.

این عکس را از یک مقاله ی IEEE در این مورد برداشته ام. الگوریتم پیشنهادی در این تصویر وجود یک “مشکل” در نقطه ی مشخص شده را پیدا کرده است. در این مورد، کسی سعی کرده است تعدادی ماشین را از تصویر پاک کند.

ieee_tamper.jpg

دقت کنید که در مورد آقای منتظری هم تنها می توان از “احتمال” دستکاری حرف زد. یعنی پاسخ الگوریتم در بسیاری موارد “احتمال دستکاری” است و نه “پاسخ قطعی” به سوال “آیا تصویر دستکاری شده است یا نه”.

پس نوشت: