بزرگ‌ترین کتابخانهٔ سایه‌ای جهان، کپی ۳۰۰ ترابایتی از پرپخش‌ترین آهنگ‌های اسپاتیفای را ساخت

به گزارش‌ها، اسپاتیفای در حال بررسی میزان موسیقی‌ای است که آرشیو آنا جمع‌آوری کرده است.


بزرگ‌ترین کتابخانهٔ سایه‌ای جهان – که به‌تدریج توسط توسعه‌دهندگان هوش مصنوعی تأمین مالی می‌شود – این آخر هفته اینترنت را با اعلام اینکه «پشتیبان‌گیری از اسپاتیفای» را انجام داده و توزیع ۳۰۰ ترابایت متادیتا و فایل‌های موسیقی را به‌صورت تورنت‌های حجیم آغاز کرده است، شگفت‌زده کرد.

به‌ گفتهٔ آرشیو آنا، این به‌دست‌آوردن داده‌ها بیش از ۹۹٪ از پخش‌ها در اسپاتیفای را پوشش می‌دهد و این آرشیو را «بزرگ‌ترین پایگاه دادهٔ متادیتای موسیقی در دسترس عمومی با ۲۵۶ میلیون ترک» می‌نامد. همچنین این «اولین آرشیو حفظ موسیقی در جهان که به‌صورت کاملاً باز است» است و ۸۶ میلیون فایل موسیقی در اختیار دارد، به‌طور که آرشیو اظهار داشت.

به‌نظر می‌رسد فایل‌های موسیقی حدود ۳۷٪ از آهنگ‌های موجود در اسپاتیفای در ژوئیهٔ ۲۰۲۵ را تشکیل دهند. فایل‌های جمع‌آوری‌شده بر اساس محبوبیت اولویت‌بندی شده‌اند و آرشیو آنا آهنگ‌هایی را که هرگز پخش نمی‌شوند یا کیفیت ضعیفی دارند – از جمله آهنگ‌های تولیدشده توسط هوش مصنوعی – حذف می‌کند.

در روز دوشنبه، اسپاتیفای به Android Authority گفت که در حال بررسی این است که آیا آرشیو آنا واقعاً به‌صورت «در مقیاس بزرگ» از پلتفرم آن داده‌برداری کرده است یا خیر، همان‌طور که وبلاگ خود ادعا کرده بود.

«یک تحقیق درباره دسترسی غیرمجاز مشخص کرد که یک طرف سوم متادیتای عمومی را جمع‌آوری کرده و با استفاده از روش‌های غیرقانونی DRM را دور زده تا به برخی از فایل‌های صوتی پلتفرم دسترسی پیدا کند»، اسپاتیفای گفت. «ما به‌ طور فعال در حال بررسی این حادثه هستیم.»

Android Authority اشاره کرد که میزان دقیق داده‌های جمع‌آوری شده از اسپاتیفای مشخص نیست و این که آیا شرکت ممکن است برای حذف تورنت‌ها اقدام قانونی پیگیری کند یا نه. هنگامیکه از اسپاتیفای برای اظهارنظر پرسیده شد، سخنگوی این شرکت به آر‌اس گفت: «اسپاتیفای حساب‌های کاربری مخرب که در جمع‌آوری غیرقانونی مشارکت داشته‌اند را شناسایی و غیرفعال کرده است.»

برای آرشیو آنا، وسوسهٔ جمع‌آوری داده‌ها شاید پس از پیدا کردن «روشی برای جمع‌آوری اسباب‌سازی اسپاتیفای در مقیاس بزرگ» که «مدتی پیش» به‌دست آمده بود، بسیار زیاد بود.

«ما نقش خود را در ساختن یک آرشیو موسیقی برای حفظ آن می‌دیدیم». جمع‌آوری داده‌های اسپاتیفای «یک شروع عالی» بود تا به ساخت «فهرست موثقی از تورنت‌ها که هدف آن نمایاندن تمام موسیقی‌های تولید شده است» برسیم، آرشیو گفت.

آرشیو می‌گوید فهرستی شبیه به این «برای موسیقی وجود ندارد» و این شبیه‌ساز LibGen خواهد بود — که توسط شرکت‌های بزرگ فناوری مانند متا و استارت‌آپ‌های نظیر Anthropic برای سرقت مجموعه‌های کتاب به‌منظور آموزش هوش مصنوعی به‌کار گرفته شد.

آرشیو آنا می‌گوید انتشار تورنت‌های متادیتا در دسامبر امسال گامی اولین برای دستیابی به این مأموریت «حفظ» بود. گام بعدی این آرشیو انتشار تورنت‌های فایل‌های موسیقی است، که ابتدا با پخش‌های پرطرفدار آغاز می‌شود و سپس به‌تدریج تورنت‌های آهنگ‌های کمتر محبوب و تصاویر آلبوم را منتشر خواهد کرد. در آینده، «اگر علاقه کافی باشد، می‌توانیم امکان دانلود فایل‌های منفرد را به آرشیو آنا اضافه کنیم»، این وبلاگ اعلام کرد.

اسپاتیفای به آرس اعلام کرد که برای جلوگیری از هر گونه جمع‌آوری غیرمجاز در آینده اقداماتی انجام می‌دهد.

سخنگوی اسپاتیفای گفت: «ما تدابیر جدیدی برای مقابله با این نوع حملات ضد حق‌نشر اجرا کرده‌ایم و به‌ طور فعال در حال نظارت بر رفتارهای مشکوک هستیم». او افزود: «از اولین روز با جامعهٔ هنرمندان در مقابل دزدی دیجیتال می‌ایستیم و به‌ طور فعال با شرکای صنعتی خود برای محافظت از خالقان و دفاع از حقوقشان همکاری می‌کنیم».

«این پاگلانه است»: کاربران از این‌که به‌دست‌آوردن داده‌ها ممکن است آرشیو را نابود کند، می‌ترسند

آرشیو آنا ادعا کرد که داده‌های اسپاتیفای برای حفظ «میراث موسیقی بشریت» جمع‌آوری شده‌اند و از «نابودی دائمی» به‌دلیل «فاجعه‌های طبیعی، جنگ‌ها، کاهش بودجه و سایر بلاها» محافظت می‌کند.

با این حال، برخی از هواداران آرشیو آنا — که عمدتاً از این موتور جستجو برای یافتن کتاب‌ها، مقالات علمی و مقالات مجلات استفاده می‌کردند — از خبر جمع‌آوری داده‌های اسپاتیفای ترسیده و نگران شدند. در Hacker News، برخی کاربران پرسیدند آیا این داده‌ها برای کسی جز پژوهشگران هوش مصنوعی مفید خواهد بود، چرا که جستجوی تورنت‌های حجیم برای پیدا کردن آهنگ‌های تک‌تک برای طرفداران موسیقی عملی به‌نظر نمی‌رسد.

یک کاربر اشاره کرد که «ابزارهایی وجود دارد که به‌ طور خودکار محتوای تلویزیونی و فیلم‌های سرقت‌شده را پیدا و به‌ طور خودکار و بر‑تقاضی پخش می‌کنند». این نشان می‌دهد که طرفداران موسیقی ممکن است راهی برای پخش این داده‌ها پیدا کنند. اما دیگران نگران این بودند که آرشیو آنا ممکن است به‌ خاطر این کار به دام افتاده باشد و خطرات قانونی را به‌عهده بگیرد؛ شرکت‌های هوش مصنوعی که تمایل دارند منبع داده‌های آموزشی خود را مخفی کنند، به‌نظر می‌رسد از این‌چنین ریسک‌هایی اجتناب می‌کنند.

«این پاگلانه است»، یکی از نظردهندگان برتر نوشت. «قطعا می‌پرسم آیا این اقدام به‌منظور ارضای خواست پژوهشگران/شرکت‌های هوش مصنوعی بوده است که به این اطلاعات نیاز داشته‌اند یا آیا برچسب‌های بزرگ موسیقی قبلاً کل کاتالوگ‌های خود را برای مقاصد آموزشی با هزینه ارزان ارائه می‌دهند؛ پس آیا این واقعاً فقط یک تلاش برای حفظ است؟»

اما آرشیو آنا واضحا برای حمایت از توسعه‌دهندگان هوش مصنوعی کار می‌کند، نظردهنده دیگری اشاره کرد که آرشیو آنا فروش «دسترسی پرسرعت» به داده‌های LLM سطح سازمانی، شامل «مجموعه‌های ناشناخته» را ترویج می‌دهد. هر کسی می‌تواند «ده‌ها هزار» را برای دسترسی به چنین داده‌ای اهدا کند، همان‌طور که در صفحهٔ وب‌سایت آن ذکر شده است، و هر پژوهشگر هوش مصنوعی می‌تواند برای بحث دربارهٔ «چگونه می‌توانیم با هم کار کنیم» تماس بگیرد.

یک سومین نظردهنده افزود: «ممکن است هوش مصنوعی هدف اصلی یا اولیهٔ آن‌ها نباشد، اما به‌ وضوح همراهی می‌کند تا به لابراتوارهای هوش مصنوعی برای حداکثر دزدی داده‌ها کمک کنند».

در همین حال، در Reddit برخی نگران بودند که آرشیو آنا خود را با جمع‌آوری این داده‌ها به نابودی کشاند. برای آن‌ها به‌نظر می‌رسید که این آرشیو تنها «خود را هدف می‌گذارد» پس از این‌که شاهد مبارزهٔ کتابخانهٔ اینترنتی برای بقا در برابر حملهٔ قانونی ناشران موسیقی بودند که سال گذشته به یک تسویه‌حساب محرمانه منجر شد.

یکی از کاربران Reddit نوشت: «من از آرشیو AA برای قرار دادن این هدف بر دوش خود خشمگینم؛ این نفوذ اسپاتیفای فقط آرشیو ادبی واقعی مهم را نابود خواهد کرد».

در حین این‌که هواداران آرشیو آنا به‌هم زدن ادامه می‌دادند، حتی نظریه‌ای توطئه‌ای مطرح شد که این آرشیو «فقط برای برادران هوش مصنوعی است که هزینهٔ آن را پشت صحنه می‌پردازند» تا آرشیو را پایدار نگه دارند.

آرس نتوانست فوراً با آرشیو آنا برای اظهارنظر دربارهٔ نگرانی کاربران یا تحقیقات اسپاتیفای تماس بگیرد.

در Reddit، یک کاربر از این واقعیت دلگرم شد که آرشیو «به‌گونه‌ای طراحی شده است که در برابر حذف شدن مقاوم باشد»، که ممکن است از وقوع اقدام قانونی جلوگیری کند.

او توضیح داد: «دامنه و موارد مشابه می‌توانند از بین بروند، اما نرم‌افزار اصلی و داده‌های آن می‌توانند بارها و بارها بازگردانده شوند».

اما همه متقاعد نشدند که آرشیو آنا می‌تواند با بارگذاری بی‌خودی‌قصد این‌چنین حجم عظیمی از داده‌های اسپاتیفای، دوام بیاورد.

یکی از کاربران هشدار داد: «این شبیه ادعای غرق‌نشدن تایتانیک است». او گفت که آرشیو آنا ممکن است در صورت ادامهٔ حذف‌های ناشی از درخواست‌های اسپاتیفای، اهدای مالی را از دست بدهد. «البته، به‌نظری در تئوری داده‌ها می‌توانند بارها بازگردند، اما هر بار این کار هزینه‌های مالی و منابعی دارد که محدود هستند. چند بار مردم حاضرند این کار را انجام دهند تا در نهایت دست از آن بکشند؟»

این گزارش به‌منظور افزودن بیانیهٔ اسپاتیفای به‌روز شد.