دیتاست ماشین لرنینگ کشور ها (جمعیت - پایتخت و ...)

دسته بندی

متنی - ماشین لرنینگ - (متنی)

تعداد خطوط

48000

لیبل خورده؟

بله

فرمت لیبل

csv

فرمت فایل

zip

منبع داده

Data2learn.ir

توضیحات

مجموعه ۴۸ هزار عددی از نام کشور ها و پایتخت ها به همراه جمعیت و طول و عرض جغرافیایی و ... مناسب جهت تسک های ماشین لرنینگ

دیتاست های مرتبط

متنی - اخبار - (News)
سری چهارم از مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد 85000 خط داده موجود می‌باشد.
تصویری - پزشکی - (Medical)
۱۶۲ عدد نمونه کیس های مثبت و منفی MRI از تومور های ریه مجموعه Decathlon که هر نمونه شامل چند صد لایه عکس می‌باشد به صورت لیبل خورده و با فرمت nii.gz که فشرده شده و به دو دسته داده آموزش و داده تست تقسیم بندی شده است.
تصویری - خودرو - (Car)
مجموعه دیتاست پلاک خودرو ها و موتور سیکلت های خارجی در فرمت YOLO لیبل خورده و به صورت تقسیم شده Train - Test - Valid و غنی شده (Augmented) آماده ترین مدل های تشخیص پلاک و ترکیب با دیتاست خودرو های ایرانی.
تصویری - متنوع - تصویری
مجموعه داده های آتش و دود از نما های مختلف و مکان های متفاوت نظیر ساختمان ها و خیابان ها و بندر ها و فرودگاه ها و ... تهیه شده با فرمت YOLO و آگمنت شده و غنی شده مناسب برای تسک های تشخیص آتش و دود با دوربین های مداربسته و ...
تصویری - کپچا - (Captcha)
کپچا عددی شامل دیجیتس ۳ و ۴ کاراکتری مناسب اسکرپر ها و لاگین فرم ها لیبل خورده برای تسک های تشخیص کاراکتر و OCR
تصویری - خودرو - (Car)
دیتاست غنی از پلاک خودرو های ایرانی، این دیتاست شامل خودرو و پلاک آن است و همچنین دارای لیبل با فرمت XML می باشد آماده ترین مدل پلاک خوان.
تصویری - خودرو - (Car)
دیتاست پلاک ماشین های ایرانی و اعداد فارسی که موقعیت پلاک روی ماشین را تعیین می‌کند در فرمت Yolo لیبل خورده و با استفاده از متود آگمنت میتوان تا ۱۰۰۰۰ هزار عدد تصویر تولید کرد این از مجموعه و روی ورژن ۱۱ یولو ترین کرد.
تصویری - نوار کانوایر - (conveyor)
دیتاست نوار کانوایر نخی به همراه تخم مرغ های لیبل خورده با فرمت لیبل json از سایت supervisely که با استفاده از متود های آگمنت میتوان تعداد آن را تا سه برابر رساند.
۴,۹۷۰,۰۰۰

تصویری - پزشکی - (Medical)
مجموعه دیتاست عکس MRI تومور مغزی مناسب جهت تسک های سمنتیک سگمنت و آنالیز عکس های پزشکی که فرمت داده ها و لیبل ها TIF بوده اصلی می‌باشد. همچنین به کمک روش های غنی سازی دیتاست (Augmentation) امکان ایجاد تصاویر بالغ بر ۲۰۰۰۰ عدد نیز می‌باشد.
متنی - اخبار - (News)
سری دوم از مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد 127309 خط داده موجود می‌باشد.
متنی - توییت - (Tweets)
مجموعه داده های کلاس بندی شده و لیبل خورده درک عواطف توییتر فارسی کلاس تعریف شده : ناراحتی - عصبانیت - شگفت زده - منزجر - لذت - ترس مناسب برای تسک های NLP و ماشین لرنینگ که به صورت کلی شامل ۱۱۳۸۳۵ خط داده متنی می‌باشد.
تصویری - خودرو - (Car)
مجموعه‌ی ۱۵,۰۰۰ تایی دیتاست OCR پلاک‌های ایرانی به‌صورت کاملاً تمیز، پردازش و دسته‌بندی‌شده آماده دانلود می‌باشد. این دیتاست با دقت بالا آماده‌سازی شده و تمامی داده‌ها پاکسازی و استانداردسازی شده‌اند تا بهترین عملکرد را در مدل‌های تشخیص متن از تصویر ارائه دهند. این مجموعه به‌صورت کامل برای آموزش مدل‌های YOLOv11 بهینه‌سازی شده و شامل ساختار استاندارد پوشه‌بندی و فایل‌های برچسب (Label) می‌باشد. همچنین داده‌ها به‌صورت اصولی به سه بخش Train / Validation / Test تقسیم‌بندی شده‌اند تا فرآیند آموزش و ارزیابی مدل به‌درستی انجام شود. تمامی تصاویر و برچسب‌ها بررسی و تست شده‌اند و از کیفیت بسیار بالایی برخوردار هستند، بنابراین می‌توانید با اطمینان از این دیتاست در پروژه‌های تحقیقاتی و تجاری خود استفاده کنید. کلاس ها : nc: 31 names: ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'ALEF', 'BE', 'PE', 'TE', 'SE', 'JIM', 'DAL', 'ZHE', 'SIN', 'SHIN', 'SAD', 'TA', 'EIN', 'GHAF', 'KAF', 'LAM', 'MIM', 'NON', 'VAV', 'HE', 'YE']
۱,۱۹۹,۰۰۰

نظرات کاربران 0 نظر
برای ثبت نظر ابتدا وارد شوید.
هنوز نظری ثبت نشده است.