دیتاست صوتی فارسی - سری ۱

دسته بندی

صوتی - متنوع - صوتی

لیبل خورده؟

بله

فرمت لیبل

txt

فرمت فایل

xz

منبع داده

Mozila

توضیحات

مجموعه داده های صوتی فارسی در قالب mp3 و دسته بندی شده به ۷ کلاس با فرمت tsv مناسب برای تبدیل صوت به متن و بلعکس

دیتاست های مرتبط

تصویری - OCR
مجموعه دیتاست تشخیص حروف پلاک ماشین های ایرانی (OCR) در قالب ۶ سری فایل با فرمت YOLO که لیبل خورده و آمده ترکیب و آگمنت و درن هایت ترین کردم مدل های ocr , lstm در کنار تسک های موقعیت یابی پلاک می‌باشد.
متنی - اخبار - (News)
مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد ۶۶۸۰۵ تا موجود می‌باشد.
متنی - ماشین لرنینگ - (متنی)
مجموعه ۴۸ هزار عددی از نام کشور ها و پایتخت ها به همراه جمعیت و طول و عرض جغرافیایی و ... مناسب جهت تسک های ماشین لرنینگ
تصویری - نوار کانوایر - (conveyor)
دیتاست تخم مرغ لیبا خورده بر روی نوار کانوایر میله ای
متنی - اخبار - (News)
سری دوم از مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد 127309 خط داده موجود می‌باشد.
تصویری - حیوانات - (Animals)
دیتاست مرغ شامل تصاویر با کیفیت بالا در شرایط نوری مختلف و تنوع بالا که لیبل خورده اجزای مختلف بدن مرغ با فرمت yoloV11 تقسیم بندی شده به داده های تست و ترین و ولید
تصویری - کپچا - (Captcha)
کپچا عددی شامل دیجیتس ۳ و ۴ کاراکتری مناسب اسکرپر ها و لاگین فرم ها لیبل خورده برای تسک های تشخیص کاراکتر و OCR
متنی - اخبار - (News)
سری چهارم از مجموعه داده های اخبار فارسی جمع آوری شده از تمامی خبرگزاری های ایران به صورت کلاس بندی شده : اخبار ورزشی - سیاسی - بین الملل - اجتماعی - اقتصادی - فرهنگی - عکس - علمی - حوادث و لیبل خورده مناسب جهت تحلیل اخبار و تسک های NLP که لینک خبر و تایتل و خلاصه آن به تعداد 85000 خط داده موجود می‌باشد.
تصویری - رباتیک - (Robotic)
دیتاست سمنتیک سگمنت (ناحیه بندی) زمین فوتبال ربات های انسانما به صورت لیبل خورده COCO Json آماده آموزش مدل.
۳,۴۹۹,۰۰۰

تصویری - خودرو - (Car)
مجموعه‌ی ۱۸,۰۰۰ تایی دیتاست ویژه تشخیص پلاک‌های ایرانی با کیفیت بالا و به‌صورت کاملاً تمیز و استاندارد آماده دانلود می‌باشد. این دیتاست به‌طور اختصاصی برای تشخیص (Detection) پلاک خودروهای ایرانی طراحی و آماده‌سازی شده است. تمامی تصاویر این مجموعه پاکسازی، بازبینی و دسته‌بندی شده‌اند و برچسب‌گذاری (Annotation) آن‌ها با دقت بالا انجام شده است. ساختار فایل‌ها کاملاً استاندارد بوده و برای آموزش مدل‌های YOLOv11 و سایر مدل‌های تشخیص شیء آماده استفاده می‌باشد. همچنین داده‌ها به‌صورت اصولی به بخش‌های Train / Validation / Test تقسیم‌بندی شده‌اند تا بتوانید فرآیند آموزش، اعتبارسنجی و ارزیابی مدل را به‌صورت حرفه‌ای انجام دهید. این دیتاست تست شده و از نظر کیفیت و دقت، عملکرد بسیار مطلوبی در پروژه‌های بینایی ماشین ارائه می‌دهد.
تصویری - پزشکی - (Medical)
مجموعه دیتاست عکس MRI تومور مغزی مناسب جهت تسک های سمنتیک سگمنت و آنالیز عکس های پزشکی که فرمت داده ها و لیبل ها TIF بوده اصلی می‌باشد. همچنین به کمک روش های غنی سازی دیتاست (Augmentation) امکان ایجاد تصاویر بالغ بر ۲۰۰۰۰ عدد نیز می‌باشد.
تصویری - خودرو - (Car)
این دیتاست شامل خودرو های داخل ایران می باشد، انواع خودرو های سواری، اتوبوس، کامیون و... مناسب برای مدل های کلاس بندی که داده ها به صپرت تقسیم شده به سه دسته Train - Test - Valid و با فرمت Yolo می‌باشند.
نظرات کاربران 2 نظر
برای ثبت نظر ابتدا وارد شوید.
  • آواتار
    ۱۸ آبان ۱۴۰۴
    چجوری دانلود کرد
    آواتار
    maze مدیر
    ۱۹ آبان ۱۴۰۴
    سلام و عرض ادب
    ابتدا دیتاست مورد نظر را به سبد خرید اضافه کنید و سپس فرایند خرید که رایگان می‌باشد تکمیل کنید.
    بعد از این لینک دانلود در همین صفحه قابل دسترس خواهد بود.