دیتاست صوتی فارسی - سری ۱
رایگان
نوع داده
دسته بندی
صوتی - متنوع - صوتی
لیبل خورده؟
بله
فرمت لیبل
txt
فرمت فایل
xz
منبع داده
Mozila
توضیحات
مجموعه داده های صوتی فارسی در قالب mp3 و دسته بندی شده به ۷ کلاس با فرمت tsv مناسب برای تبدیل صوت به متن و بلعکس
دیتاست های مرتبط
تصویری - رباتیک - (Robotic)
مجموعه غنی تصاویر لیبل خورده تشخیص توپ در زمین فوتبال ربات های انسانما که لیبل ها با فرمت Yolov11 میباشد همچنین داده ها به صورت train test valid تقسیم بندی شده است که کاملا آماده آموزش مدل میباشد.
متنی - توییت - (Tweets)
مجموعه داده های کلاس بندی شده و لیبل خورده درک عواطف توییتر فارسی کلاس تعریف شده : ناراحتی - عصبانیت - شگفت زده - منزجر - لذت - ترس مناسب برای تسک های NLP و ماشین لرنینگ که به صورت کلی شامل ۱۱۳۸۳۵ خط داده متنی میباشد.
تصویری - خودرو - (Car)
این دیتاست شامل خودرو های داخل ایران می باشد، انواع خودرو های سواری، اتوبوس، کامیون و... مناسب برای مدل های کلاس بندی که داده ها به صپرت تقسیم شده به سه دسته Train - Test - Valid و با فرمت Yolo میباشند.
تصویری - پوشاک - (Clothes)
این مجموعه داده برای مسابقه طبقه بندی کفش EdgeNet Topcoder جمع آوری شد که شامل ۶ کلاس دسته بندی boots, sneakers, flip flops, loafers, sandals, and soccer shoes میباشد. همچنین داده ها به دو دسته train و valid تقسیم بندی شده است.
متنی - اخبار - (News)
سری سوم از مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد ۵۵۶۴۹ خط داده موجود میباشد.
متنی - اخبار - (News)
سری دوم از مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد 127309 خط داده موجود میباشد.
تصویری - نوار کانوایر - (conveyor)
دیتاست تخم مرغ لیبا خورده بر روی نوار کانوایر میله ای
متنی - اخبار - (News)
سری چهارم از مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد 85000 خط داده موجود میباشد.
تصویری - نوار کانوایر - (conveyor)
دیتاست نوار کانوایر نخی به همراه تخم مرغ های لیبل خورده با فرمت لیبل json از سایت supervisely که با استفاده از متود های آگمنت میتوان تعداد آن را تا سه برابر رساند.
تصویری - خودرو - (Car)
مجموعهی ۱۵,۰۰۰ تایی دیتاست OCR پلاکهای ایرانی بهصورت کاملاً تمیز، پردازش و دستهبندیشده آماده دانلود میباشد. این دیتاست با دقت بالا آمادهسازی شده و تمامی دادهها پاکسازی و استانداردسازی شدهاند تا بهترین عملکرد را در مدلهای تشخیص متن از تصویر ارائه دهند.
این مجموعه بهصورت کامل برای آموزش مدلهای YOLOv11 بهینهسازی شده و شامل ساختار استاندارد پوشهبندی و فایلهای برچسب (Label) میباشد. همچنین دادهها بهصورت اصولی به سه بخش Train / Validation / Test تقسیمبندی شدهاند تا فرآیند آموزش و ارزیابی مدل بهدرستی انجام شود.
تمامی تصاویر و برچسبها بررسی و تست شدهاند و از کیفیت بسیار بالایی برخوردار هستند، بنابراین میتوانید با اطمینان از این دیتاست در پروژههای تحقیقاتی و تجاری خود استفاده کنید.
کلاس ها :
nc: 31
names: ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'ALEF', 'BE', 'PE', 'TE', 'SE', 'JIM', 'DAL', 'ZHE', 'SIN', 'SHIN', 'SAD', 'TA', 'EIN', 'GHAF', 'KAF', 'LAM', 'MIM', 'NON', 'VAV', 'HE', 'YE']
تصویری - OCR
مجموعه دیتاست تشخیص حروف پلاک ماشین های ایرانی (OCR) در قالب ۶ سری فایل با فرمت YOLO که لیبل خورده و آمده ترکیب و آگمنت و درن هایت ترین کردم مدل های ocr , lstm در کنار تسک های موقعیت یابی پلاک میباشد.
متنی - ماشین لرنینگ - (متنی)
مجموعه ۴۸ هزار عددی از نام کشور ها و پایتخت ها به همراه جمعیت و طول و عرض جغرافیایی و ...
مناسب جهت تسک های ماشین لرنینگ
ابتدا دیتاست مورد نظر را به سبد خرید اضافه کنید و سپس فرایند خرید که رایگان میباشد تکمیل کنید.
بعد از این لینک دانلود در همین صفحه قابل دسترس خواهد بود.