دیتاست صوتی فارسی - سری ۱

دسته بندی

صوتی - متنوع - صوتی

لیبل خورده؟

بله

فرمت لیبل

txt

فرمت فایل

xz

منبع داده

Mozila

توضیحات

مجموعه داده های صوتی فارسی در قالب mp3 و دسته بندی شده به ۷ کلاس با فرمت tsv مناسب برای تبدیل صوت به متن و بلعکس

دیتاست های مرتبط

تصویری - رباتیک - (Robotic)
مجموعه غنی تصاویر لیبل خورده تشخیص توپ در زمین فوتبال ربات های انسانما که لیبل ها با فرمت Yolov11 می‌باشد همچنین داده ها به صورت train test valid تقسیم بندی شده است که کاملا آماده آموزش مدل می‌باشد.
۲,۴۹۹,۰۰۰

متنی - توییت - (Tweets)
مجموعه داده های کلاس بندی شده و لیبل خورده درک عواطف توییتر فارسی کلاس تعریف شده : ناراحتی - عصبانیت - شگفت زده - منزجر - لذت - ترس مناسب برای تسک های NLP و ماشین لرنینگ که به صورت کلی شامل ۱۱۳۸۳۵ خط داده متنی می‌باشد.
تصویری - خودرو - (Car)
این دیتاست شامل خودرو های داخل ایران می باشد، انواع خودرو های سواری، اتوبوس، کامیون و... مناسب برای مدل های کلاس بندی که داده ها به صپرت تقسیم شده به سه دسته Train - Test - Valid و با فرمت Yolo می‌باشند.
تصویری - پوشاک - (Clothes)
این مجموعه داده برای مسابقه طبقه بندی کفش EdgeNet Topcoder جمع آوری شد که شامل ۶ کلاس دسته بندی boots, sneakers, flip flops, loafers, sandals, and soccer shoes می‌باشد. همچنین داده ها به دو دسته train و valid تقسیم بندی شده است.
متنی - اخبار - (News)
سری سوم از مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد ۵۵۶۴۹ خط داده موجود می‌باشد.
متنی - اخبار - (News)
سری دوم از مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد 127309 خط داده موجود می‌باشد.
تصویری - نوار کانوایر - (conveyor)
دیتاست تخم مرغ لیبا خورده بر روی نوار کانوایر میله ای
متنی - اخبار - (News)
سری چهارم از مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد 85000 خط داده موجود می‌باشد.
تصویری - نوار کانوایر - (conveyor)
دیتاست نوار کانوایر نخی به همراه تخم مرغ های لیبل خورده با فرمت لیبل json از سایت supervisely که با استفاده از متود های آگمنت میتوان تعداد آن را تا سه برابر رساند.
۴,۹۷۰,۰۰۰

تصویری - خودرو - (Car)
مجموعه‌ی ۱۵,۰۰۰ تایی دیتاست OCR پلاک‌های ایرانی به‌صورت کاملاً تمیز، پردازش و دسته‌بندی‌شده آماده دانلود می‌باشد. این دیتاست با دقت بالا آماده‌سازی شده و تمامی داده‌ها پاکسازی و استانداردسازی شده‌اند تا بهترین عملکرد را در مدل‌های تشخیص متن از تصویر ارائه دهند. این مجموعه به‌صورت کامل برای آموزش مدل‌های YOLOv11 بهینه‌سازی شده و شامل ساختار استاندارد پوشه‌بندی و فایل‌های برچسب (Label) می‌باشد. همچنین داده‌ها به‌صورت اصولی به سه بخش Train / Validation / Test تقسیم‌بندی شده‌اند تا فرآیند آموزش و ارزیابی مدل به‌درستی انجام شود. تمامی تصاویر و برچسب‌ها بررسی و تست شده‌اند و از کیفیت بسیار بالایی برخوردار هستند، بنابراین می‌توانید با اطمینان از این دیتاست در پروژه‌های تحقیقاتی و تجاری خود استفاده کنید. کلاس ها : nc: 31 names: ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'ALEF', 'BE', 'PE', 'TE', 'SE', 'JIM', 'DAL', 'ZHE', 'SIN', 'SHIN', 'SAD', 'TA', 'EIN', 'GHAF', 'KAF', 'LAM', 'MIM', 'NON', 'VAV', 'HE', 'YE']
۱,۱۹۹,۰۰۰

تصویری - OCR
مجموعه دیتاست تشخیص حروف پلاک ماشین های ایرانی (OCR) در قالب ۶ سری فایل با فرمت YOLO که لیبل خورده و آمده ترکیب و آگمنت و درن هایت ترین کردم مدل های ocr , lstm در کنار تسک های موقعیت یابی پلاک می‌باشد.
متنی - ماشین لرنینگ - (متنی)
مجموعه ۴۸ هزار عددی از نام کشور ها و پایتخت ها به همراه جمعیت و طول و عرض جغرافیایی و ... مناسب جهت تسک های ماشین لرنینگ
نظرات کاربران 2 نظر
برای ثبت نظر ابتدا وارد شوید.
  • آواتار
    ۱۸ آبان ۱۴۰۴
    چجوری دانلود کرد
    آواتار
    maze مدیر
    ۱۹ آبان ۱۴۰۴
    سلام و عرض ادب
    ابتدا دیتاست مورد نظر را به سبد خرید اضافه کنید و سپس فرایند خرید که رایگان می‌باشد تکمیل کنید.
    بعد از این لینک دانلود در همین صفحه قابل دسترس خواهد بود.