۱.بخش اول : نرمافزار OCR و اصلاح خودکار خطاها: توسعه سیستمی برای تبدیل تصاویر اسکنشده کتابهای دینی با متن تایپی (فارسی و عربی) به متن دیجیتال با استفاده از فناوری OCR و اصلاح خودکار خطاهای متنی با مدلهای زبانی محلی آموزشدیده. ۲. بخش دوم :دستیار هوشمند پرسش و پاسخ از کتاب: ایجاد یک سیستم وبمحور برای انتخاب کتاب از قائمیه، پرسیدن سؤالات مرتبط با محتوا، استخراج بخشهای مرتبط، تولید پاسخهای دقیق، و دریافت بازخورد کاربر. ۳. بخش سوم: تگگذاری خودکار: توسعه سیستمی برای تحلیل خودکار محتوای کتابها و تخصیص برچسبهای معنایی سلسلهمراتبی به کتابها، فصلها، و پاراگرافها.
خلاصه اهداف و فعالیتهای پروژهها ۱. بخش OCR و اصلاح خطاها: توسعه مدل OCR برای تبدیل تصاویر اسکنشده (که بصورت متن تایپی و دیجیتالی میباشد) به متن دیجیتال با پشتیبانی از فونتهای متنوع فارسی و عربی، و ایجاد مدل زبانی برای تشخیص و اصلاح خطاهای OCR با استفاده از متون قائمیه. ۲. بخش دستیار هوشمند: نمایهسازی کتابها، توسعه مدل جستجوی معنایی برای یافتن بخشهای مرتبط با سؤالات کاربر، تولید پاسخهای منسجم، و ایجاد رابط کاربری وب با قابلیت بازخورد. ۳. بخش تگگذاری خودکار: تعریف برچسبهای سلسلهمراتبی، آموزش مدل برای تخصیص خودکار برچسبهای سطح پایین به بخشهای کتاب، و ارائه API برای ادغام با سیستم قائمیه.




