

در یک وبسایت خبری پربازدید، با توجه به حجم بالای کامنتهای کاربران، نیازمند توسعه یک سیستم هوشمند تشخیص خودکار کامنتهای نامناسب هستیم که قادر باشد هر کامنت جدید را بر اساس موضوع مطلب اصلی و قوانین محتوایی تعیین شده (مانند محتوای نظامی، سیاسی، رکیک، توهینآمیز یا دارای حساسیت فرهنگی) بررسی کند و تنها کامنتهای مطابق با قوانین را به صورت خودکار تأیید کند.
این سیستم باید بر پایه مدل زبانی BERT فارسی (ParsBERT) یا شبیه آن طراحی و توسعه یابد و در محیط داخلی سرورهای کارفرما بدون استفاده از هیچ API خارجی یا خدمات ابری خارجی اجرا شود. این موضوع به دلیل حساسیت بالای موضوعی و الزامات قانونی در حوزه مطبوعات و مدیریت محتوای کاربری اجباری است.
نحوه عملکرد سیستم: با استفاده از PHP ، کامنتهای جدید از دیتابیس وبسایت خبری دریافت شده و در صف (Queue) قرار میگیرند. این صف توسط یک سرویس داخلی به بخش Python + Transformers ارسال میشود. در این بخش، با استفاده از مدل ParsBERT (یا مدل معادل)، کامنت بررسی شده و نتیجه آن به صورت خودکار به بخش PHP بازگردانده میشود. بر اساس نتیجه، کامنت تأیید یا رد میشود.
ویژگیهای مورد نیاز سیستم: قابلیت پشتیبانی از حجم بالای کامنتهای ورودی با حداقل تاخیر اجرای کامل در محیط داخلی و بدون وابستگی به سرویسهای خارجی قابلیت آموزش مجدد (re-training) مدل بر اساس قوانین جدید محتوایی امنیت بالا در تمام لایههای برنامه و عدم امکان دسترسی غیرمجاز به دادهها
مهارتهای مورد نیاز: تسلط به PHP برای ایجاد Queue و مدیریت ارتباط با دیتابیس تجربه کار با Python در حوزه پردازش زبان طبیعی (NLP) آشنایی عمیق با مدلهای زبانی ParsBERT و کتابخانه HuggingFace Transformers توانایی نصب، پیکربندی و آموزش مجدد مدلهای NLP در محیط محلی تجربه کار با سیستمعامل لینوکس و مدیریت سرورهای وب دانش فنی در زمینه بهینهسازی سرعت پردازش مدلهای زبانی آشنایی با استانداردهای امنیتی در محیطهای داخلی و حساس
نکات مهم:
تمامی دادهها، مدلها و اطلاعات این پروژه کاملا محرمانه بوده و تحت هیچ شرایطی نباید در بیرون از محیط کارفرما استفاده یا ذخیره شوند. دقت و کیفیت بالا در پیادهسازی این پروژه اولویت اصلی است، چرا که پروژه در حوزهای بحرانی و تحت نظارت قرار دارد.
فریلنسر باید قادر به مدیریت مستقل پروژه از مرحله طراحی تا اجرا باشد.




