یک ایده ناب برای “کی به کیه؟”
توسط کمانگیر در روز 29 فوریه 2008فوریه 29
شده از شادی بترکی؟
آقا ما هی نشستیم مخ ریختیم روی این “کی به کیه؟” دیدیم نمی شه. تعداد وبلاگهای ایرانی خیلی زیاده. بعد یک ایده مشتی به ذهنمون رسید. چرا اصلا جریان رو اینطور نکنیم.
۱- با یک وبلاگ شروع کن و تمام لینکهاشو در بیار و به لیست اضافه کن.
۲- از بین تمام وبلاگهای موجود ۱% بالا از نظر تعداد لینکهای ورودی رو پیدا کن و بررسی دقیق کن.
۳- برو به ۲٫
مشتی نیست؟ ایده ساده است اما بنظرم جالب ه. مرحمت کنید خیلی ایده چرندی ه بنظرتون یه ۲۴ ساعتی صبر کنید حظ ما نپکه. چاکریم.
ببینیم چی در میاد !
کمانگیر: تا یکی دو روز دیگه یکسری نتیجه منتشر می کنم.
من ۲۴ ساعت صبر می کنم ((:
شما را به عنوان انیشتین وبلاگستان پارسی انتخاب می کنیم باشد که بیشتر بترکانید.
کمانگیر: چاکریم بابا. 🙂
توی این فصل اون هم توی وینی پگ امکان نداره یک سیب روی کله ات افتاده باشه. پس حتماً توی حموم این ایده به سرت زده!
D:
فکر کنم باید ۲ تا نکته را در نظر بگیری یکی اینکه این عمل هرس کردن را نباید از همون اول شروع کنی چون مجموعه ات از لحاظ آماری خیلی کوچیک می شود به قول خودمون حساسیت به نویز و شرایط اولیه زیاد می شود . یک چیز دیگر هم بیش می آید یک سری وبلاگ هستند مثل وبلاگ خودت یا یک سری خبرگزاری ها که در عمل خیلی خیلی بهشون لینک داده می شود ولی خیلی لینک به بیرون تولید نمی کنند و عملا به هم لینک تولید می کنند به عبارت دیگر جز این صدک بالا بقیه عموما مصرف کننده لینک هستند. من احساس می کنم که این نحوه هرس کردن می تواند نتایج آماری تو را غیر کلی کند. به نظر من اگر همین کار را انجام بدهی ولی نه با صدک بالا بلکه مثلا با هزارک ها مختلف از قسمت های مختلف هیستوگرام ، فکر کنم مجموعه مورد بررسی جنرال تر می شود.
کمانگیر: رفیق؟ اینجا که کلی لینک هست!
من نفهمیدم چی شد D:
فکر میکنم اشکال از ۱٪ باشه٬ این یک عدده؟ دقیقاً ۱٪ از چیزیه؟ یا «ی» نکره است به منظور «درصد بالائی از…»
البته چون همه فهمیدن لابد اشکال از منه ولی من رو هم بفهمونید لطفند 🙂
کمانگیر: چاکریم رفیق. منظورم دقیقا ۱% بود.
ایده ات محشره. سوال دارم:
http://blog.nim.ir/?p=519
کمانگیر: چاکریم نیما جان. دارم می خونم پست شما رو.
کمانگیرجان، متنی که دوستی برات نوشته بود و در زمانه بازنشر شده را دیدم و به اینجا رسیدم. به نظرم میرسه که هم ایده تو و هم ایده اون محققان واکسیناسیون شباهت زیادی به روش جستجوی اپتیمم در ژنتیک الگوریتم داره. و بنابراین باید سرعت بالایی در رسیدن به جواب داشته باشه.
در ایده ات هم فرآیند بازتولید تکراری نمونه ها را داری هم فرآیند رقابت و حذف نمونه های ضعیفتر را. به نظرم اگر جهش ژنتیک را هم اضافه کنی کاملا روی الگوی ژنتیک الگوریتم پیش میری. پیش نهاد خاص من اینه که یک ضریب خیلی کوچک در حد چندصدم انتخاب کنی و هر بار که لیست یک درصد بالا را تشکیل میدی تعداد کمی عضو رندم هم به اونها اضافه کنی مثلا اگه یک درصد بالای لیستت ۱۰۰ تا وبلاگه ۳ تا هم تصادفی قاطیش کنی و انالیز را برای ۱۰۳ عضو انجام بدی. این سه عضو اضافه به احتمال زیاد در اکثر دورهای اجرای برنامه ات جزو ضعیف ترین ها خواهند بود و حذف میشند. اما حسنش اینه که احتمال محدود شدن الگوریتم در محدوده های خاصی از فضای جستجو را کمتر میکنه.
این ایده ترکیب کردن تصادفی درصد کمی از افراد با درصد زیادی از آدمهایی که توسط دوستانشون معرفی شدند به احتمال زیاد در اون برنامه واکسیناسیون هم بوده وگرنه احتمال جاافتادن جزیره های ارتباطی در اون مساله خیلی زیاده.
موفق باشی و منتظر دیدن نتایج کارت هستم.
کمانگیر: بسیار ممنونم قربان از نظر شما.