پروژه باز
قیمت بیشترین اهمیت را دارد.مدل ocr تصویر به متن
ایجاد شده توسط
با سلام
یک مدل نیاز دارم برای تبدیل متون در قالب تصویر و pdf به متن
از فونت های رایج پشتیبانی کنه
فارسی و انگلیسی رو میخام تشخیص بده
از سیستم tesseract ocr استفاده میکنم مدل های خودش زیاد دقیق نیست و فاصله ها و کاما رو زیاد درست تشخیص نمیده و خیلی فونت ها رو نمیشناسه و حالت فارسی و انگلیسی با هم که میزارم هم درست تشخیص نمیده
تصریح
tesseract یک پروژه متن باز هست برای تبدیل عکس به متن تایپ شده
https://tesseract-ocr.github.io/tessdoc/
از زبان فارسی هم پشتیبانی می کنه فقط اشکلاتی داره و نیاز هست با روش هایی مثل fine tune و افزودن کارکترهای بیشتر اون رو تقویت کرد. میشه با توجه به داکیومنت ها داخل منبع پروژه با استفاده از روش هایی تعریف شده این کار رو کرد و قبلا افراد و سایت هایی زبان فارسی رو ارتقا دادن اما فایل های ترین
traindata بصورت عمومی منتشر نشده.
در حال حاضر وبسایت https://matnyaar.ir کیفیت خوبی در تبدیل عکس به متن داره و انتظار می ره فایل بعد از ترین کردن نتیجه ای مشابه سایت ذکر شده داشته باشد.
در حال حاضر مدل زبان فارسی fas.traindata که در گیت هاب هست ویرگول، نیم فاصله و برخی دیگر از کارکترها رو به خوبی شناسایی نمی کنه نیاز هست این مدل بهبود داده بشه و در آخر فایل ارتقا یافته fas.traindata تحویل داده شود.
01 آبان 1403 17:04
الگوریتم
هوش مصنوعی (AI)
پایتون (Python)
زمان باقیمانده برای ارسال پیشنهاد
پیشنهادها3
زمان باقیمانده برای ارسال پیشنهاد
بودجه کارفرما
پیشنهادها3
فریلنسرهایی که در این پروژه پیشنهاد ارسال کردهاند
آخرین پروژه های توسعه نرمافزار و آیتی
projects