موتور جستجوي پارسي جو


موتور جستجوي پارسي جو

 موتور جستجوگر پارسی جو

امروزه موتورهاي جستجو از ارکان اصلي توسعة فناوري ارتباطات و اطلاعات درکشورهاي پيشرفتهبه حساب مي‌آيند. در کشور ما نيز سامانة پارسي‌جو به عنوان اولين موتور جستجوي بومي کشور با تلاشهاي چهارسالة گروه بيست نفره از متخصصان ايراني طراحي و پياده سازي شده است.

هدف اصلي پارسي‌جو ارائة سرويس جستجوي فارسي و ديگر سرويسهاي بومي مبتني بر وب به مردم ايران زمين‌ مي‌باشد.

پارسي جو يک موتور مستقل بوده و از هيچ موتور جستجوي ديگري استفاده نمي‌کند. در حال حاضر، پارسي‌جودر آدرس http://www.parsijoo.ir قابل دسترس است.

صفحة اول پارسي‌جو

اگرچه پارسي‌جو هم‌اکنون در مرحلة آزمايشي قرار دارد، ليکن در حال حاضر نيزبسياري از قابليتهاي مهم آن توسط عموم مردم قابل استفادهاست.از مهمترين اين قابليتها مي‌توان به موارد زير اشاره نمود:

الف) امکان جستجوي متن در بيش از ۲۰۰ ميليون صفحة وب فارسي

اين صفحات وب از طريق گذرگاه رسمي شبکة کشور انتخاب شده‌اند، لذا داراي محتويات امن و مطمئن مي‌باشند.

پارسي‌جو مجهز به خطاياب و پردازشگر عبارات فارسي براي رفع خطاهاي احتمالي در پرسشهاي کاربران مي‌باشد.

در قسمت جستجوي وب مي‌توان از شگردهاي مختلفي نظير نمايش آب و هوا و اوقات شرعي يک شهر در چند روز آيندهاستفاده نمود.

بعلاوه، صفحة اول پارسي‌جو حاوي اطلاعات مفيدي در مورد تاريخ و ساعت، دما، اوقات شرعي و آب و هواي کنوني شهر مي‌باشد.

در نسخة آزمايشي فعلي، نتايج جستجو در بسياري از پرسشهاي کاربران قابل رقابت با موتورهاي جستجوي برجسته نظير گوگل و بينگ مي‌باشد.

بزودي، نسخة جديدي از پارسي‌جو به بهره‌برداري مي‌رسد که امکان جستجو در بيش از ۳۰۰ ميليون صفحه وب فارسي و در زماني بسيار کوتاهتر را فراهم مي‌سازد.

در ضمن، کيفيت صفحات انتخابي نيز از نظر ارزش اطلاعاتي و رتبه‌بندي بهبود قابل توجهي يافته است.

جستجو در وب

استفاده از شگردهاي جستجو (براي مثال، پيش‌بيني آب و هواي يک شهر در چند روز آينده)

ب) امکان جستجوي تصوير در بيش از ۱۰ ميليون عکس

اين تصاوير عمدتاً از صفحات وب فارسي استخراج شده‌اند و همانند جستجوي وب، سرويس جستجوي تصوير نيز تا حد امکان داراي محتويات امن و مطمئن مي‌باشد. بزودي، پارسي‌جو قادر به جستجو در بيش از ۳۰ ميليون عکس موجود در وب خواهد بود.

جستجو در تصاوير

ج) سرويس ترجمه

اين سرويس قابليت ترجمة دو زبانة متن از فارسي به انگليسي، انگليسي به فارسي و پينگليش به فارسي را دارا مي‌باشد. نسخة آزمايشي اين سرويس به صورت روزانه در حال بهبود و بروزرساني مي‌باشد.

سرويس ترجمه

د) امکان جستجوي علمي در بيش از يک ميليون مقالة فارسي و دانلود آنها

ه) امکان جستجو و دانلود نرم افزار، بازي، فيلم و انيميشن از سايتهاي مجاز دانلود فارسي

گفتني است نسخة موبايل پارسي‌جو نيز به بهره‌برداري رسيده است و تمام سرويسهاي فوق به راحتي با استفاده از گوشي‌هاي هوشمند تلفن همراه و از طريق آدرس http://www.parsijoo.irدر دسترس مي‌باشند.

معماري پارسي­جو

پارسي جو از سه بخش اصلي تشکيل شده است.

الف) خزشگر (crawler) :

خزشگر پارسي‌جو که Parsijoo نام دارد به صورت هوشمند وب را پيمايش نموده و صفحات را جمع آوري مي­کند. در حال حاضر خزشگر پارسي‌جو، قادر به خزش دويست ميليون صفحه وب به صورت متوالي مي­باشد.

نسخه جديد آن که بزودي بر روي وب قرار مي­گيرد قادر است بيش از يک ميليارد صفحه وب را جمع­آوري کند. در اين بخش اسناد وب فارسي با يک سياست مناسب بر مبناي پوشش و تازگي از وب جمع‌آوري مي‌شو‌ند.

يکي از مباحث مهم اين بخش کشف صفحات مهم فارسي مي‌شود که اين عمل با استفاده از الگوريتمي به نام FICA+ انجام مي‌گيرد.

روش FICA+ که توسط طراحان پارسي جو ارائه شده است صفحات مهم فارسي را با استفاده از روش يادگيري تقويتي کشف کرده و سپس بارگذاري مي‌کند.

ب) نمايه ساز:

در اين بخش متن خالص از اسناد فارسي (مانند HTML، DOC و PDF) بارگذاري شده، توسط خزشگر استخراج شده و با توجه به خصوصيات زبان فارسي نرمال سازي شده و سپس عمل نمايه سازي انجام مي‌گيرد.

در اين بخش از يک پردازشگر فارسي براي پردازش کلمات و عبارات فارسي استفاده مي­شود که اين پردازشگر قادر است عمليات فاصله گذاري و يکسان سازي کدينگ‌هاي استفاده شده را انجام دهد.

همچنين تصاوير و بقيه اسناد در اين بخش پردازش مي­شوند. کل اين مجموعه عمليات بر روي يک بستر توزيع شده اجرا مي­گردد.

ج) بخش بازيابي و جستجو:

اين بخش که به صورت برخط عمل مي کند و با کاربر در ارتباط است، در ابتدا پرس‌جو را از کاربر گرفته و پس از پردازش آن، اسناد مرتبط را از بخش نمايه‌ساز بازيابي مي‌کند.

در نهايت اسناد با استفاده از روش‌هاي هوشمند رتبه بندي مانند الگوريتمهايA3Crank و DistnaceRankرتبه بندي گرديده و به کاربر ارائه مي شوند.

اين دو الگوريتم نوين توسط تيم پارسي‌جو طراحي و ارائه شده‌اند.

gd

یک دیدگاه برای ”موتور جستجوي پارسي جو

  1. اینکه خیلی خوبه… ایران هم برای خودش موتور جستجو داره! تا اینقدر پیشرفت شده؟ موفق باشند.

دیدگاه‌ها بسته شده‌اند.