با سلام و احترام. یک تست آزمایشگاهی به شرح زیر انجام شده است: یک لوله فولادی روی خاک قرار گرفته و از طریق سقوط یک وزنه ضربهای به این لوله وارد شده است. روی این لوله نشانههایی با رنگبندی متفاوت تعبیه شده و از این تست با دوربین موبایل یک فیلم با زاویه دوربین عمود بر تصویر گرفته شده است. درخواست بنده از شما این است که به کمک پردازش تصویر، یک نمودار از جابهجایی قائم نشانه برحسب زمان و فریم در بازه زمانی قبل و بعد از برخورد وزنه به لوله تهیه کرده و براساس آن جابهجایی قائم لوله در لحظه برخورد و لحظه جدا شدن لوله از زمین را به دست آورید. همچنین یک گزارش از نحوه انجام کار به همراه دادههای پروژه از شما میخواهم. با تشکر
لیست پروژههای پردازش تصویر
پروژههای پردازش تصویر
با سلام و احترام. یک تست آزمایشگاهی به شرح زیر انجام شده است: یک لوله فولادی روی خاک قرار گرفته و از طریق سقوط یک وزنه ضربهای به این لوله وارد شده است. روی این لوله نشانههایی با رنگبندی متفاوت تعبیه شده و از این تست با دوربین موبایل یک فیلم با زاویه دوربین عمود بر تصویر گرفته شده است. درخواست بنده از شما این است که به کمک پردازش تصویر، یک نمودار از جابهجایی قائم نشانه برحسب زمان و فریم در بازه زمانی قبل و بعد از برخورد وزنه به لوله تهیه کرده و براساس آن جابهجایی قائم لوله در لحظه برخورد و لحظه جدا شدن لوله از زمین را به دست آورید. همچنین یک گزارش از نحوه انجام کار به همراه دادههای پروژه از شما میخواهم. با تشکر
درخواست طراحی و پیاده سازی پروژه پردازش تصویر
- دو عدد دوربین مداربسته تحت شبکه در ورودی و خروجی مجموعه
متصل به سرور پردازش تصویر جهت انجام موارد زیر :
- ثبت و ذخیره تصویر افراد هنگام ورود به مجموعه
- ثبت زمان ورود و خروج افراد به همراه تصویر
- جستجوی تصویر در بین افرادی که در مجموعه تردد داشتند
- هشدار ورود افرادی که تصویر قبلا بارگذاری شده است
- قابلیت اسکریپت نویسی و اتصال به پنل پیام کوتاه
برای سرور از نرم افزار های غیر تجاری مانند Viseron استفاده شود منابع سخت افزاری مورد نیاز با اعلام فریلنسر تهیه می گردد.
اولویت پروژه : سابقه پروژه مرتبط ، امتیاز و تعداد پروژه انجام شده می باشد.
باتشکر
درخواست طراحی و پیاده سازی پروژه پردازش تصویر
- دو عدد دوربین مداربسته تحت شبکه در ورودی و خروجی مجموعه
متصل به سرور پردازش تصویر جهت انجام موارد زیر :
- ثبت و ذخیره تصویر افراد هنگام ورود به مجموعه
- ثبت زمان ورود و خروج افراد به همراه تصویر
- جستجوی تصویر در بین افرادی که در مجموعه تردد داشتند
- هشدار ورود افرادی که تصویر قبلا بارگذاری شده است
- قابلیت اسکریپت نویسی و اتصال به پنل پیام کوتاه
برای سرور از نرم افزار های غیر تجاری مانند Viseron استفاده شود منابع سخت افزاری مورد نیاز با اعلام فریلنسر تهیه می گردد.
اولویت پروژه : سابقه پروژه مرتبط ، امتیاز و تعداد پروژه انجام شده می باشد.
باتشکر
پروژه حاضر شامل ماژول تشخیص فرد و حرکات او و دنیال کننده فرد می باشد که افراد را از هم تمایز داده و فرد مورد نظر را در حین حرکت تشخیص داده ، فاصله ربات از فرد و میزان جا به جایی در جهت های مختلف را متوجه شده و گزارش می نماید. ضمنا به عنوان راه تعاملی با کاربر، حرکات دست، سر و پا را برای فرمان دادن و تعیین وضعیت به ربات از هم تشخیص دهد (مثلا به منظور اعمال فرمان ایست، حرکت و ....) زمانبندی اجرای پروژه به مدت 1 ماه از واریز پیش پرداخت بوده و سورس کد پروژه نیز در انتها باید در اختیار گذاشته شود. ضمن اینکه بازه زمانی 6 ماهه برای پشتیبانی در نظر گرفته شده است. سخت افزار پیشنهادی انتخاب و استفاده از تبلت اندرویدی و استفاده از دوربین های تبلت به منظور بررسی محیط و شناسایی کاربر روی تبلت اندرویدی *لازم به ذکر است ربات مذکور و زیرساخت حرکتی آماده می باشد و محصول صنعتی می باشد. در این پروژه صرفا بخش هوش مصنوعی و پردازش تصویر قرار است به آن اضافه گردد. توضیحات کامل و جزئیات در فایل ضمیمه آمده است
پروژه حاضر شامل ماژول تشخیص فرد و حرکات او و دنیال کننده فرد می باشد که افراد را از هم تمایز داده و فرد مورد نظر را در حین حرکت تشخیص داده ، فاصله ربات از فرد و میزان جا به جایی در جهت های مختلف را متوجه شده و گزارش می نماید. ضمنا به عنوان راه تعاملی با کاربر، حرکات دست، سر و پا را برای فرمان دادن و تعیین وضعیت به ربات از هم تشخیص دهد (مثلا به منظور اعمال فرمان ایست، حرکت و ....) زمانبندی اجرای پروژه به مدت 1 ماه از واریز پیش پرداخت بوده و سورس کد پروژه نیز در انتها باید در اختیار گذاشته شود. ضمن اینکه بازه زمانی 6 ماهه برای پشتیبانی در نظر گرفته شده است. سخت افزار پیشنهادی انتخاب و استفاده از تبلت اندرویدی و استفاده از دوربین های تبلت به منظور بررسی محیط و شناسایی کاربر روی تبلت اندرویدی *لازم به ذکر است ربات مذکور و زیرساخت حرکتی آماده می باشد و محصول صنعتی می باشد. در این پروژه صرفا بخش هوش مصنوعی و پردازش تصویر قرار است به آن اضافه گردد. توضیحات کامل و جزئیات در فایل ضمیمه آمده است
در این پروژه نیاز داریم تا با استفاده از Unity HDRP، یک برنامه شبیه سازی مغز سه بعدی تولید کنیم که از انواع فرمت ورودی تصاویر پزشکی مانند تصاویر MRI و CT - SCAN در فرمت های استاندارد آنها مانند nifti, DICOM و استانداردهای غیره ( ورودیهای دو بعدی و یا سه بعدی، مش سه بعدی یا تصاویر باینری ) پشتیبانی کند. در این شبیه سازی استفاده از قابلیتهای ویژه ی Unity HDRP اهمیت ویژه ای دارد. امکانات خاص HDRP بعنوان برتری این شبیه ساز ارایه میشود تا توانایی ها و قابلیتهای بیشتر و جدیدی ارایه کند.
ورودی می تواند هر فرمت تصویری یا مش سه بعدی و یا تصاویر باینری باشد و خروجی سه بعدی شیشه ای را در Unity HDRP ارائه دهد.
خروجیهای مورد نیاز:
1- فایل سورس و خروجی برنامه ی ساخته شده در یونیتی UnityHDRP جهت پردازش فایلهای ورودی از MRI و CT-SCAN 2- گزارشهای هفتگی بصورت پاورپوینت درمورد پیشرفت پروژه به دو منظور الف)ارایه به کارفرمای پروژه ب) توضیحات لازم در مورد جزییات اجرا و اشتراک گذاشتن روند توسعه ی خروجی پروژه
تمامی مستندات و گزارشها به زبان انگلیسی مورد نیاز است.
پیشنهادات : برای ورودیهای تصویر باینری، باید الگوریتمهایی مانند marching cubes را استفاده کنید. برای mesh 3 بعدی، باید کدهای بنویسید تا انواع فرمت های مختلف را مدیریت کند.
پروژه ی انجام شده باید حداقل موارد زیر را شامل شود:
1- بررسی ابزارهای تجسم سه بعدی موجود و قابلیت ها و همینطور نقاط ضعف انها (SUMA AFNI، paraview، fibernavigator، و freesurfer freeview)
2- پیشنهادات و راه حل هایی برای بهبود ابزارهای موجود (بعنوان مثال محدودیت قابلیت های نور پردازی، محدودیت سفارشی سازی shader)
3- توانایی و برتری یونیتی برای حل محدودیتهای نرم افزارهای های موجود و نحوه ی رفع محدودها در یونیتی (مانند HDRP, custom shaders, custom render piplelines, batched mesh rendering calls و موارد پیشنهادی مجری کار جهت بهبود کیفیت )
۴- روش و متد انجام پروژه و ارزیابی کیفیت نهایی و مقایسه با کیفیت ابزارهای موجود
در این پروژه نیاز داریم تا با استفاده از Unity HDRP، یک برنامه شبیه سازی مغز سه بعدی تولید کنیم که از انواع فرمت ورودی تصاویر پزشکی مانند تصاویر MRI و CT - SCAN در فرمت های استاندارد آنها مانند nifti, DICOM و استانداردهای غیره ( ورودیهای دو بعدی و یا سه بعدی، مش سه بعدی یا تصاویر باینری ) پشتیبانی کند. در این شبیه سازی استفاده از قابلیتهای ویژه ی Unity HDRP اهمیت ویژه ای دارد. امکانات خاص HDRP بعنوان برتری این شبیه ساز ارایه میشود تا توانایی ها و قابلیتهای بیشتر و جدیدی ارایه کند.
ورودی می تواند هر فرمت تصویری یا مش سه بعدی و یا تصاویر باینری باشد و خروجی سه بعدی شیشه ای را در Unity HDRP ارائه دهد.
خروجیهای مورد نیاز:
1- فایل سورس و خروجی برنامه ی ساخته شده در یونیتی UnityHDRP جهت پردازش فایلهای ورودی از MRI و CT-SCAN 2- گزارشهای هفتگی بصورت پاورپوینت درمورد پیشرفت پروژه به دو منظور الف)ارایه به کارفرمای پروژه ب) توضیحات لازم در مورد جزییات اجرا و اشتراک گذاشتن روند توسعه ی خروجی پروژه
تمامی مستندات و گزارشها به زبان انگلیسی مورد نیاز است.
پیشنهادات : برای ورودیهای تصویر باینری، باید الگوریتمهایی مانند marching cubes را استفاده کنید. برای mesh 3 بعدی، باید کدهای بنویسید تا انواع فرمت های مختلف را مدیریت کند.
پروژه ی انجام شده باید حداقل موارد زیر را شامل شود:
1- بررسی ابزارهای تجسم سه بعدی موجود و قابلیت ها و همینطور نقاط ضعف انها (SUMA AFNI، paraview، fibernavigator، و freesurfer freeview)
2- پیشنهادات و راه حل هایی برای بهبود ابزارهای موجود (بعنوان مثال محدودیت قابلیت های نور پردازی، محدودیت سفارشی سازی shader)
3- توانایی و برتری یونیتی برای حل محدودیتهای نرم افزارهای های موجود و نحوه ی رفع محدودها در یونیتی (مانند HDRP, custom shaders, custom render piplelines, batched mesh rendering calls و موارد پیشنهادی مجری کار جهت بهبود کیفیت )
۴- روش و متد انجام پروژه و ارزیابی کیفیت نهایی و مقایسه با کیفیت ابزارهای موجود
طراحی نرمافزار دوربین صنعتی کوره سیمان (ویندوز) – پردازش تصویر + هوش مصنوعی
توضیحات پروژه:
به یک برنامهنویس یا تیم حرفهای نیاز داریم برای طراحی و توسعه نرمافزار دوربین صنعتی مخصوص کوره سیمان تحت ویندوز. نرمافزار باید قابلیتهای زیر را ارائه دهد:
• تشخیص دما بر اساس رنگ تصویر (Color Temperature Detection).
• کنترل کامل تنظیمات دوربین (مشابه یک دستگاه NVR) شامل فوکوس، زوم، روشنایی، کنتراست و … .
• بهبود و تثبیت کیفیت تصویر (Image Enhancement & Stabilization) در محیطهای پرحرارت و دارای نویز.
• امکان استفاده از هوش مصنوعی یا الگوریتمهای پردازش تصویر برای مراحل پیشرفته:
• تحلیل تغییرات شعله
• صدور فرمانهای کنترلی (مثلاً اگر شعله کوره زیاد شد، فرمان کاهش سوخت ارسال شود).
• رابط کاربری ساده، صنعتی و پایدار (تمرکز بر عملکرد و قابلیت اطمینان، نه طراحی گرافیکی پیچیده).
• امکان پشتیبانی و توسعه در آینده (افزودن قابلیتهای کنترلی یا ماژولهای جدید).
شرایط همکاری
• زمان تحویل پروژه با توجه به پیچیدگی کار قابل توافق است.
• بودجه قابل مذاکره بر اساس تواناییها و پیشنهاد فنی.
• داشتن نمونه کار مشابه در زمینههای پردازش تصویر صنعتی، بینایی ماشین یا AI مزیت محسوب میشود.
• تعهد به پشتیبانی پس از تحویل پروژه الزامی است.
نحوه ارائه پیشنهاد
لطفاً در پیشنهاد خود به موارد زیر اشاره کنید:
• تجربه در پردازش تصویر، دوربینهای صنعتی یا سیستمهای NVR.
• تکنولوژیها و زبانهای پیشنهادی (مثلاً Python, C++, OpenCV, TensorFlow و …).
• برآورد زمان و هزینه تقریبی.
📌 دستهبندی پیشنهادی: پردازش تصویر – هوش مصنوعی – نرمافزارهای صنعتی. 📌 توضیح تکمیلی برای فریلنسرها: پروژه در محیط کوره
طراحی نرمافزار دوربین صنعتی کوره سیمان (ویندوز) – پردازش تصویر + هوش مصنوعی
توضیحات پروژه:
به یک برنامهنویس یا تیم حرفهای نیاز داریم برای طراحی و توسعه نرمافزار دوربین صنعتی مخصوص کوره سیمان تحت ویندوز. نرمافزار باید قابلیتهای زیر را ارائه دهد:
• تشخیص دما بر اساس رنگ تصویر (Color Temperature Detection).
• کنترل کامل تنظیمات دوربین (مشابه یک دستگاه NVR) شامل فوکوس، زوم، روشنایی، کنتراست و … .
• بهبود و تثبیت کیفیت تصویر (Image Enhancement & Stabilization) در محیطهای پرحرارت و دارای نویز.
• امکان استفاده از هوش مصنوعی یا الگوریتمهای پردازش تصویر برای مراحل پیشرفته:
• تحلیل تغییرات شعله
• صدور فرمانهای کنترلی (مثلاً اگر شعله کوره زیاد شد، فرمان کاهش سوخت ارسال شود).
• رابط کاربری ساده، صنعتی و پایدار (تمرکز بر عملکرد و قابلیت اطمینان، نه طراحی گرافیکی پیچیده).
• امکان پشتیبانی و توسعه در آینده (افزودن قابلیتهای کنترلی یا ماژولهای جدید).
شرایط همکاری
• زمان تحویل پروژه با توجه به پیچیدگی کار قابل توافق است.
• بودجه قابل مذاکره بر اساس تواناییها و پیشنهاد فنی.
• داشتن نمونه کار مشابه در زمینههای پردازش تصویر صنعتی، بینایی ماشین یا AI مزیت محسوب میشود.
• تعهد به پشتیبانی پس از تحویل پروژه الزامی است.
نحوه ارائه پیشنهاد
لطفاً در پیشنهاد خود به موارد زیر اشاره کنید:
• تجربه در پردازش تصویر، دوربینهای صنعتی یا سیستمهای NVR.
• تکنولوژیها و زبانهای پیشنهادی (مثلاً Python, C++, OpenCV, TensorFlow و …).
• برآورد زمان و هزینه تقریبی.
📌 دستهبندی پیشنهادی: پردازش تصویر – هوش مصنوعی – نرمافزارهای صنعتی. 📌 توضیح تکمیلی برای فریلنسرها: پروژه در محیط کوره
با سلام حتما نمونه کار هوش مصنوعی بینایی ماشین داشته باشید حتما تمامی مراحل باید توضیح و آموزش کامل داده شود به ما )از طریق همین صفحه کار) API نمیخواییم،تحلیل تحت وب(روی سرور اصلی) نمیخواییم
مدت زمان پروژه تحویل پروتوتایپ 7 روز: 2.000.000 تحویل کار یکماه 5.000.000 پشتیبانی 1 ماه بعد تحویل 3.000.000
نزدیک به 150 ویدئو از مسواک زدن موجود هست.که سورت نشده اصلا
باید خروجی قابل استفاده در سمت کلاینت موبایل(اندروید) تحویل بدهید. برنامه به عنوان افزونه به یک اپلیکیشن دیگر متصل میشود که کار شناسایی مسواک زدن رو خودکار میکنه و دیگه نیاز به تایید دستی نیست.
با سلام حتما نمونه کار هوش مصنوعی بینایی ماشین داشته باشید حتما تمامی مراحل باید توضیح و آموزش کامل داده شود به ما )از طریق همین صفحه کار) API نمیخواییم،تحلیل تحت وب(روی سرور اصلی) نمیخواییم
مدت زمان پروژه تحویل پروتوتایپ 7 روز: 2.000.000 تحویل کار یکماه 5.000.000 پشتیبانی 1 ماه بعد تحویل 3.000.000
نزدیک به 150 ویدئو از مسواک زدن موجود هست.که سورت نشده اصلا
باید خروجی قابل استفاده در سمت کلاینت موبایل(اندروید) تحویل بدهید. برنامه به عنوان افزونه به یک اپلیکیشن دیگر متصل میشود که کار شناسایی مسواک زدن رو خودکار میکنه و دیگه نیاز به تایید دستی نیست.
عنوان پروژه: تبدیل هوشمند فایلهای PDF به فرمت JSON با Google Cloud AI
شرح پروژه:
۱) خلاصه پروژه: هدف این پروژه، استخراج دقیق و ساختاریافته محتوای کامل کتابهای درسی فارسی از فایلهای PDF و تبدیل آنها به فرمت JSON است. محتوای کتابها شامل متون فارسی، تصاویر، جداول، فرمولهای ریاضی و علمی و بخشهای مختلفی نظیر کار در کلاس، فعالیت، تمرین و ... میباشد. انتظار میرود این فرآیند با دقت بالا و به صورت ساختاریافته برای هر کتاب، فصل به فصل انجام شود.
۲) فناوریهای مورد استفاده (الزامی): پروژه باید با استفاده از قویترین و جدیدترین مدلهای هوش مصنوعی گوگل انجام شود. رویکرد ترکیبی زیر الزامی است:
- Google Document AI: برای استخراج دقیق و ساختاریافته محتوا از اسناد. این سرویس به عنوان هسته اصلی پروژه، باید برای موارد زیر استفاده شود:
- Document OCR Processor: برای تشخیص متن و ساختار کلی (پاراگرافها، عنوانها، لیستها).
- Table Parser Processor: برای شناسایی و استخراج دقیق دادهها از جداول به صورت سطر و ستون.
- مدل Gemini 2.5 Pro: برای پردازش محتوای چندوجهی مانند تصاویر و فرمولها. از این مدل برای تبدیل فرمولهای ریاضی به فرمت LaTeX و تولید توضیحات (Caption) برای تصاویر استفاده خواهد شد. پالایش و ساختاردهی نهایی خروجی به فرمت JSON.
۳) خروجی مورد انتظار:
- خروجی نهایی باید برای هر فصل از کتاب یک فایل JSON مجزا باشد که ساختاری جامع و یکپارچه داشته باشد.
- هر فایل JSON باید شامل محتوای صفحه به صفحه باشد که تمامی المانها (متن، جدول، تصویر، فرمول) در آن به صورت ساختاریافته و قابل استفاده قرار گرفته باشند.
- ساختار JSON باید به گونهای باشد که به سادگی قابل استفاده در برنامههای کاربردی باشد.
۴) الزامات و انتظارات:
- دقت بالا: استخراج متن فارسی، جداول و فرمولها باید با بالاترین دقت ممکن انجام شود.
- حفظ ساختار: خروجی JSON باید ساختار اصلی کتاب (فصلها، صفحات، تیترها، پاراگرافها) را به درستی منعکس کند.
- قابلیت مقیاسپذیری: راهکار ارائه شده باید قابلیت پردازش تعداد زیادی فایل PDF را داشته باشد.
۵) تعداد فایل و صفحات:
- 250 عنوان کتاب
- 34,000 صفحه
دستهبندی پروژه: توسعه نرمافزار و آیتی
از تمامی علاقمندان و متخصصین دعوت میشود تا با ما در ارتباط باشند و با ارائه تجربیات و نمونه کاریهای خود، علاقهمندی خود را در این پروژه اعلام کنند.
عنوان پروژه: تبدیل هوشمند فایلهای PDF به فرمت JSON با Google Cloud AI
شرح پروژه:
۱) خلاصه پروژه: هدف این پروژه، استخراج دقیق و ساختاریافته محتوای کامل کتابهای درسی فارسی از فایلهای PDF و تبدیل آنها به فرمت JSON است. محتوای کتابها شامل متون فارسی، تصاویر، جداول، فرمولهای ریاضی و علمی و بخشهای مختلفی نظیر کار در کلاس، فعالیت، تمرین و ... میباشد. انتظار میرود این فرآیند با دقت بالا و به صورت ساختاریافته برای هر کتاب، فصل به فصل انجام شود.
۲) فناوریهای مورد استفاده (الزامی): پروژه باید با استفاده از قویترین و جدیدترین مدلهای هوش مصنوعی گوگل انجام شود. رویکرد ترکیبی زیر الزامی است:
- Google Document AI: برای استخراج دقیق و ساختاریافته محتوا از اسناد. این سرویس به عنوان هسته اصلی پروژه، باید برای موارد زیر استفاده شود:
- Document OCR Processor: برای تشخیص متن و ساختار کلی (پاراگرافها، عنوانها، لیستها).
- Table Parser Processor: برای شناسایی و استخراج دقیق دادهها از جداول به صورت سطر و ستون.
- مدل Gemini 2.5 Pro: برای پردازش محتوای چندوجهی مانند تصاویر و فرمولها. از این مدل برای تبدیل فرمولهای ریاضی به فرمت LaTeX و تولید توضیحات (Caption) برای تصاویر استفاده خواهد شد. پالایش و ساختاردهی نهایی خروجی به فرمت JSON.
۳) خروجی مورد انتظار:
- خروجی نهایی باید برای هر فصل از کتاب یک فایل JSON مجزا باشد که ساختاری جامع و یکپارچه داشته باشد.
- هر فایل JSON باید شامل محتوای صفحه به صفحه باشد که تمامی المانها (متن، جدول، تصویر، فرمول) در آن به صورت ساختاریافته و قابل استفاده قرار گرفته باشند.
- ساختار JSON باید به گونهای باشد که به سادگی قابل استفاده در برنامههای کاربردی باشد.
۴) الزامات و انتظارات:
- دقت بالا: استخراج متن فارسی، جداول و فرمولها باید با بالاترین دقت ممکن انجام شود.
- حفظ ساختار: خروجی JSON باید ساختار اصلی کتاب (فصلها، صفحات، تیترها، پاراگرافها) را به درستی منعکس کند.
- قابلیت مقیاسپذیری: راهکار ارائه شده باید قابلیت پردازش تعداد زیادی فایل PDF را داشته باشد.
۵) تعداد فایل و صفحات:
- 250 عنوان کتاب
- 34,000 صفحه
دستهبندی پروژه: توسعه نرمافزار و آیتی
از تمامی علاقمندان و متخصصین دعوت میشود تا با ما در ارتباط باشند و با ارائه تجربیات و نمونه کاریهای خود، علاقهمندی خود را در این پروژه اعلام کنند.
عنوان پروژه: تحلیل تصاویر با استفاده از شبکه عصبی و خودرمزگذار در پایتون
توضیحات پروژه:
در این پروژه، هدف ما تحلیل و پردازش تصاویر مختلف با استفاده از شبکههای خودرمزگذار (Autoencoder) در زبان برنامهنویسی پایتون است. این فرآیند شامل مراحل زیر میباشد:
پیشپردازش دادهها: در این مرحله، تصاویر ورودی به منظور بهینهسازی و آمادهسازی برای مدل، پردازش خواهند شد. این شامل تغییر اندازه، نرمالسازی و سایر تکنیکهای لازم است.
آموزش مدل: در این گام، ما از تصاویر پردازش شده برای آموزش یک مدل خودرمزگذار استفاده خواهیم کرد که به ما امکان استخراج ویژگیهای مهم تصاویر را میدهد.
تولید تصویر نهایی: پس از آموزش موفق مدل، از آن برای تولید خروجی به صورت تصاویر جدید استفاده خواهیم کرد که نشاندهندهی ویژگیهای استخراجشده از تصاویر ورودی خواهد بود.
نیازمندیها:
- تسلط بر زبان برنامهنویسی پایتون
- آشنایی با مفاهیم شبکههای عصبی و به ویژه خودرمزگذارها
- تجربه در پیشپردازش دادههای تصویری
- توانایی در توسعه و آموزش مدلهای یادگیری ماشین
دستهبندی پروژه: توسعه نرمافزار و آیتی
از تمامی علاقهمندان و افرادی که در این زمینه تجربه دارند دعوت میشود تا برای همکاری در این پروژه اقدام کنند.
عنوان پروژه: تحلیل تصاویر با استفاده از شبکه عصبی و خودرمزگذار در پایتون
توضیحات پروژه:
در این پروژه، هدف ما تحلیل و پردازش تصاویر مختلف با استفاده از شبکههای خودرمزگذار (Autoencoder) در زبان برنامهنویسی پایتون است. این فرآیند شامل مراحل زیر میباشد:
پیشپردازش دادهها: در این مرحله، تصاویر ورودی به منظور بهینهسازی و آمادهسازی برای مدل، پردازش خواهند شد. این شامل تغییر اندازه، نرمالسازی و سایر تکنیکهای لازم است.
آموزش مدل: در این گام، ما از تصاویر پردازش شده برای آموزش یک مدل خودرمزگذار استفاده خواهیم کرد که به ما امکان استخراج ویژگیهای مهم تصاویر را میدهد.
تولید تصویر نهایی: پس از آموزش موفق مدل، از آن برای تولید خروجی به صورت تصاویر جدید استفاده خواهیم کرد که نشاندهندهی ویژگیهای استخراجشده از تصاویر ورودی خواهد بود.
نیازمندیها:
- تسلط بر زبان برنامهنویسی پایتون
- آشنایی با مفاهیم شبکههای عصبی و به ویژه خودرمزگذارها
- تجربه در پیشپردازش دادههای تصویری
- توانایی در توسعه و آموزش مدلهای یادگیری ماشین
دستهبندی پروژه: توسعه نرمافزار و آیتی
از تمامی علاقهمندان و افرادی که در این زمینه تجربه دارند دعوت میشود تا برای همکاری در این پروژه اقدام کنند.
به دنبال همکاری با برنامهنویس مسلط به Python برای توسعه رباتی سبک در بستر بازی آنلاین موبایل هستم.
این پروژه شامل پردازش تصویر از صفحهنمایش گوشی و واکنش تعاملی ربات در محیط بازیه، بنابراین تخصص در این موارد مهمه:
- تسلط به پردازش تصویر (مثلاً OpenCV یا کتابخانههای مشابه)
- آشنایی با شبکههای عصبی و یادگیری ماشین
- توانایی تعامل با رابط کاربری در اندروید (موبایل)
💡 پروژه حجم زیادی نداره و قابل انجام توسط یک متخصص توانمند در بازهی زمانی معقول هست. اما خلاقیت، دقت و شناخت کافی از تعامل انسانگونه با رابطهای تصویری لازمه.
📬 جزئیات دقیقتر پروژه در پیام خصوصی ارائه میشه.
به دنبال همکاری با برنامهنویس مسلط به Python برای توسعه رباتی سبک در بستر بازی آنلاین موبایل هستم.
این پروژه شامل پردازش تصویر از صفحهنمایش گوشی و واکنش تعاملی ربات در محیط بازیه، بنابراین تخصص در این موارد مهمه:
- تسلط به پردازش تصویر (مثلاً OpenCV یا کتابخانههای مشابه)
- آشنایی با شبکههای عصبی و یادگیری ماشین
- توانایی تعامل با رابط کاربری در اندروید (موبایل)
💡 پروژه حجم زیادی نداره و قابل انجام توسط یک متخصص توانمند در بازهی زمانی معقول هست. اما خلاقیت، دقت و شناخت کافی از تعامل انسانگونه با رابطهای تصویری لازمه.
📬 جزئیات دقیقتر پروژه در پیام خصوصی ارائه میشه.
با سلام من برای مدیریت تردد خودرو و موتور سیکلت در یک پارکینگ عمومی به یک ای پی آی تشخیص پلاک خودرو و موتور ایرانی نیاز دارم. در واقع وسایل نقلیه در ابتدای ورود به پارکینگ در پشت گیت ورودی در مقابل یک دوربین پلاک خوان قرار میگیرند و توسط یک اپراتور تصویری از خودرو گرفته میشود و به ای پی ای ارسال میشود. این ای پی ای بهتر است که به زبان سی شارپ نوشته شود. اما اگه شما میتوانید به زبان دیگه ای هم پیاده کنید مشکلی ندارد. روال کار نرم افزار اینطوریه که ما یه تصویر حاوی پلاک رو بهش میدیم. و اون در خروجی به ما متنی حاوی پلاک تشخیص داده شده رو بر میگردونه. این تصویر ممکنه کیفیت خیلی بالایی داشته باشه یا نداشته باشه. اما در هر صورت پلاک توسط انسان قابل شناسایی هست. حالا میخواییم این تصویر رو از طریق یه دکمه انتخاب کنیم و بعد نرم افزار در یه باکس متنی، متن پلاک رو بهمون بده. همینطور با توجه به تعداد کاراکتر ها تشخیص بده که پلاک برای خودرو هست یا موتور. نیازی به تشخیص پلاک در شرایط کم نور، تاری تصویر، کثیف بودن پلاک یا تصاویر خیلی کم کیفیت نیست. چون در نهایت این نرم افزار قراره پلاک خودروی متوقف در فضای مناسب از نظر نوری رو تشخیص بده. اما نرم افزار باید بالای 85 % موفق به خوندن کامل پلاک از تصویر بشه. ضمنا برای یه سیستمی که دسکتاپ هست و دارای یک سی پی یو ی معمولی مثل کور ای فاو نسل های 8 یا 9 هست باید فرایند پردازش در کمتر 4 ثانیه انجام بشه. لطفا عزیزانی که در این زمینه تجربه و دانش کافی دارند اطلاع بدهند. با تشکر.
با سلام من برای مدیریت تردد خودرو و موتور سیکلت در یک پارکینگ عمومی به یک ای پی آی تشخیص پلاک خودرو و موتور ایرانی نیاز دارم. در واقع وسایل نقلیه در ابتدای ورود به پارکینگ در پشت گیت ورودی در مقابل یک دوربین پلاک خوان قرار میگیرند و توسط یک اپراتور تصویری از خودرو گرفته میشود و به ای پی ای ارسال میشود. این ای پی ای بهتر است که به زبان سی شارپ نوشته شود. اما اگه شما میتوانید به زبان دیگه ای هم پیاده کنید مشکلی ندارد. روال کار نرم افزار اینطوریه که ما یه تصویر حاوی پلاک رو بهش میدیم. و اون در خروجی به ما متنی حاوی پلاک تشخیص داده شده رو بر میگردونه. این تصویر ممکنه کیفیت خیلی بالایی داشته باشه یا نداشته باشه. اما در هر صورت پلاک توسط انسان قابل شناسایی هست. حالا میخواییم این تصویر رو از طریق یه دکمه انتخاب کنیم و بعد نرم افزار در یه باکس متنی، متن پلاک رو بهمون بده. همینطور با توجه به تعداد کاراکتر ها تشخیص بده که پلاک برای خودرو هست یا موتور. نیازی به تشخیص پلاک در شرایط کم نور، تاری تصویر، کثیف بودن پلاک یا تصاویر خیلی کم کیفیت نیست. چون در نهایت این نرم افزار قراره پلاک خودروی متوقف در فضای مناسب از نظر نوری رو تشخیص بده. اما نرم افزار باید بالای 85 % موفق به خوندن کامل پلاک از تصویر بشه. ضمنا برای یه سیستمی که دسکتاپ هست و دارای یک سی پی یو ی معمولی مثل کور ای فاو نسل های 8 یا 9 هست باید فرایند پردازش در کمتر 4 ثانیه انجام بشه. لطفا عزیزانی که در این زمینه تجربه و دانش کافی دارند اطلاع بدهند. با تشکر.
این پروژه با هدف تولید و بهبود کیفیت تصاویر پاتولوژی سرطان سینه با استفاده از شبکههای مولد متخاصم (GAN) طراحی شده است. هدف اصلی، ایجاد تصاویری با وضوح بالا، بدون تاری و با ابعاد مناسب (بزرگتر از تصاویر فعلی) است. این پروژه به دنبال حل مشکلات کنونی کد GAN موجود است که تصاویری با کیفیت پایین یا تار تولید میکند.
خروجیهای مورد انتظار تصاویر تولیدشده با کیفیت بالا و بدون تاری. ابعاد تصاویر بزرگتر از تصاویر فعلی گزارش معیارهای ارزیابی (مانند FID ) برای مقایسه کیفیت تصاویر
شرایط دسترسی به سختافزار مناسب (مانند GPU) برای آموزش مدل آشنایی با دیتاستهای پزشکی مهارتهای مورد نیاز: تسلط به یادگیری عمیق، شبکههای مولد متخاصم (GAN)، پردازش تصویر، Python، و فریمورکهای TensorFlow
این پروژه با هدف تولید و بهبود کیفیت تصاویر پاتولوژی سرطان سینه با استفاده از شبکههای مولد متخاصم (GAN) طراحی شده است. هدف اصلی، ایجاد تصاویری با وضوح بالا، بدون تاری و با ابعاد مناسب (بزرگتر از تصاویر فعلی) است. این پروژه به دنبال حل مشکلات کنونی کد GAN موجود است که تصاویری با کیفیت پایین یا تار تولید میکند.
خروجیهای مورد انتظار تصاویر تولیدشده با کیفیت بالا و بدون تاری. ابعاد تصاویر بزرگتر از تصاویر فعلی گزارش معیارهای ارزیابی (مانند FID ) برای مقایسه کیفیت تصاویر
شرایط دسترسی به سختافزار مناسب (مانند GPU) برای آموزش مدل آشنایی با دیتاستهای پزشکی مهارتهای مورد نیاز: تسلط به یادگیری عمیق، شبکههای مولد متخاصم (GAN)، پردازش تصویر، Python، و فریمورکهای TensorFlow
در این پروژه، هدف طراحی و پیادهسازی یک سامانه هوشمند است که بتواند با دریافت تصویر چهرهی یک فرد، هویت احتمالی او را از طریق جستجوی تصویری در وب و تحلیل دادههای مرتبط تشخیص دهد. این سیستم از الگوریتمهای پیشرفتهی جستجوی معکوس تصویر (Reverse Image Search) و تشخیص چهره (Face Recognition) استفاده خواهد کرد و با تکیه بر منابع آنلاین (نظیر پایگاههای داده عمومی و نتایج گوگل یا Bing Image Search)، مشخصاتی همچون نام، شغل، ملیت یا لینکهای مرتبط با آن فرد را بازیابی میکند. مراحل اجرایی پروژه:
پیشپردازش تصویر ورودی
شامل حذف نویز، بهبود کنتراست، و تنظیم روشنایی برای بهبود عملکرد الگوریتمهای تشخیص.
استخراج ویژگی چهره
با استفاده از مدلهایی مانند ArcFace یا FaceNet. Dlib ویژگیهای منحصربهفرد چهره استخراج میشود.
انطباق چهره با چهره موجود در وب
به کمک APIهای جستجوی تصویری (مانند Google Reverse Image Search یا Microsoft Bing Visual Search) تصویر مشابه جستجو شده و لینکها و شبکههای مرتبط بازیابی میشوند.
تحلیل دادههای متنی برگرفته از صفحات بازیابیشده
با استفاده از مدلهای NLP مانند BERT برای تحلیل متن اطراف تصویر در صفحات میگردد تا مشخصات فرد استخراج شود.
ارائه خروجی نهایی
خروجی سیستم شامل لیستی از نتایج احتمالی، درصد اطمینان، و دادههای ساختاریافته (نام، سن، کشور، پیوندهای رسمی) خواهد بود.تحلیل عملکرد:
با فرض استفاده از آخرین الگوریتمهای جستجوی تصویر و استفاده از سختافزار مناسب (پیشنهاد: پردازنده گرافیکی Radeon RX 7600)، نرخ عملکرد سیستم به مواردی مانند کیفیت تصویر، وجود دادههای مشابه در وب، و شباهتهای مرزی بین افراد بستگی دارد.
اگر چهره واضح و اطلاعات فرد در منابع عمومی قابل دسترسی باشد، و مدل مورد استفاده fine-tuned شده باشد، زمان انتظار پاسخ در مدتزمان حدود ۱ ساعت.
احتمال بازیابی هویت صحیح حدود تا ۸۵ درصد باشد.
در موارد خاص (چهرههای مشهور یا پراستناد در پایگاههای عمومی)، این احتمال بیش از ۹۰ درصد باشد.پیشنیازها:
آشنایی با Python، PyTorch، OpenCV یا TensorFlow
آشنایی با REST APIها و کار با مرورگرهای خودکار مانند Selenium
GPU قابل پشتیبانی برای اجرای مدلهای سنگین یادگیری عمیقدر این پروژه، هدف طراحی و پیادهسازی یک سامانه هوشمند است که بتواند با دریافت تصویر چهرهی یک فرد، هویت احتمالی او را از طریق جستجوی تصویری در وب و تحلیل دادههای مرتبط تشخیص دهد. این سیستم از الگوریتمهای پیشرفتهی جستجوی معکوس تصویر (Reverse Image Search) و تشخیص چهره (Face Recognition) استفاده خواهد کرد و با تکیه بر منابع آنلاین (نظیر پایگاههای داده عمومی و نتایج گوگل یا Bing Image Search)، مشخصاتی همچون نام، شغل، ملیت یا لینکهای مرتبط با آن فرد را بازیابی میکند. مراحل اجرایی پروژه:
پیشپردازش تصویر ورودی
شامل حذف نویز، بهبود کنتراست، و تنظیم روشنایی برای بهبود عملکرد الگوریتمهای تشخیص.
استخراج ویژگی چهره
با استفاده از مدلهایی مانند ArcFace یا FaceNet. Dlib ویژگیهای منحصربهفرد چهره استخراج میشود.
انطباق چهره با چهره موجود در وب
به کمک APIهای جستجوی تصویری (مانند Google Reverse Image Search یا Microsoft Bing Visual Search) تصویر مشابه جستجو شده و لینکها و شبکههای مرتبط بازیابی میشوند.
تحلیل دادههای متنی برگرفته از صفحات بازیابیشده
با استفاده از مدلهای NLP مانند BERT برای تحلیل متن اطراف تصویر در صفحات میگردد تا مشخصات فرد استخراج شود.
ارائه خروجی نهایی
خروجی سیستم شامل لیستی از نتایج احتمالی، درصد اطمینان، و دادههای ساختاریافته (نام، سن، کشور، پیوندهای رسمی) خواهد بود.تحلیل عملکرد:
با فرض استفاده از آخرین الگوریتمهای جستجوی تصویر و استفاده از سختافزار مناسب (پیشنهاد: پردازنده گرافیکی Radeon RX 7600)، نرخ عملکرد سیستم به مواردی مانند کیفیت تصویر، وجود دادههای مشابه در وب، و شباهتهای مرزی بین افراد بستگی دارد.
اگر چهره واضح و اطلاعات فرد در منابع عمومی قابل دسترسی باشد، و مدل مورد استفاده fine-tuned شده باشد، زمان انتظار پاسخ در مدتزمان حدود ۱ ساعت.
احتمال بازیابی هویت صحیح حدود تا ۸۵ درصد باشد.
در موارد خاص (چهرههای مشهور یا پراستناد در پایگاههای عمومی)، این احتمال بیش از ۹۰ درصد باشد.پیشنیازها:
آشنایی با Python، PyTorch، OpenCV یا TensorFlow
آشنایی با REST APIها و کار با مرورگرهای خودکار مانند Selenium
GPU قابل پشتیبانی برای اجرای مدلهای سنگین یادگیری عمیقسلام من تعداد زیادی تصویر از محصولات فروشگاهی دارم که توسط خودمون گرفته شده. میخوام این تصاویر رو در قالب یک دیتابیس داخل جایی قرار بدم و یک سیستم جستجو تصویر مثل گوگل داشته باشم که بتونم با آپلود یک عکس، سیستم به من کد محصول رو بگه. این سیستم جستجوی تصویر میتونه از هر سرویس دهنده، api و زبان برنامه نویسی باشه. کافیه یه فایل ویدیویی از راه اندازی سرویس برای من تهیه کنید تا خودم اون رو راه اندازی کنم. باتشکر
سلام من تعداد زیادی تصویر از محصولات فروشگاهی دارم که توسط خودمون گرفته شده. میخوام این تصاویر رو در قالب یک دیتابیس داخل جایی قرار بدم و یک سیستم جستجو تصویر مثل گوگل داشته باشم که بتونم با آپلود یک عکس، سیستم به من کد محصول رو بگه. این سیستم جستجوی تصویر میتونه از هر سرویس دهنده، api و زبان برنامه نویسی باشه. کافیه یه فایل ویدیویی از راه اندازی سرویس برای من تهیه کنید تا خودم اون رو راه اندازی کنم. باتشکر