به گزارشها، اسپاتیفای در حال بررسی میزان موسیقیای است که آرشیو آنا جمعآوری کرده است.


بزرگترین کتابخانهٔ سایهای جهان – که بهتدریج توسط توسعهدهندگان هوش مصنوعی تأمین مالی میشود – این آخر هفته اینترنت را با اعلام اینکه «پشتیبانگیری از اسپاتیفای» را انجام داده و توزیع ۳۰۰ ترابایت متادیتا و فایلهای موسیقی را بهصورت تورنتهای حجیم آغاز کرده است، شگفتزده کرد.
به گفتهٔ آرشیو آنا، این بهدستآوردن دادهها بیش از ۹۹٪ از پخشها در اسپاتیفای را پوشش میدهد و این آرشیو را «بزرگترین پایگاه دادهٔ متادیتای موسیقی در دسترس عمومی با ۲۵۶ میلیون ترک» مینامد. همچنین این «اولین آرشیو حفظ موسیقی در جهان که بهصورت کاملاً باز است» است و ۸۶ میلیون فایل موسیقی در اختیار دارد، بهطور که آرشیو اظهار داشت.
بهنظر میرسد فایلهای موسیقی حدود ۳۷٪ از آهنگهای موجود در اسپاتیفای در ژوئیهٔ ۲۰۲۵ را تشکیل دهند. فایلهای جمعآوریشده بر اساس محبوبیت اولویتبندی شدهاند و آرشیو آنا آهنگهایی را که هرگز پخش نمیشوند یا کیفیت ضعیفی دارند – از جمله آهنگهای تولیدشده توسط هوش مصنوعی – حذف میکند.
در روز دوشنبه، اسپاتیفای به Android Authority گفت که در حال بررسی این است که آیا آرشیو آنا واقعاً بهصورت «در مقیاس بزرگ» از پلتفرم آن دادهبرداری کرده است یا خیر، همانطور که وبلاگ خود ادعا کرده بود.
«یک تحقیق درباره دسترسی غیرمجاز مشخص کرد که یک طرف سوم متادیتای عمومی را جمعآوری کرده و با استفاده از روشهای غیرقانونی DRM را دور زده تا به برخی از فایلهای صوتی پلتفرم دسترسی پیدا کند»، اسپاتیفای گفت. «ما به طور فعال در حال بررسی این حادثه هستیم.»
Android Authority اشاره کرد که میزان دقیق دادههای جمعآوری شده از اسپاتیفای مشخص نیست و این که آیا شرکت ممکن است برای حذف تورنتها اقدام قانونی پیگیری کند یا نه. هنگامیکه از اسپاتیفای برای اظهارنظر پرسیده شد، سخنگوی این شرکت به آراس گفت: «اسپاتیفای حسابهای کاربری مخرب که در جمعآوری غیرقانونی مشارکت داشتهاند را شناسایی و غیرفعال کرده است.»
برای آرشیو آنا، وسوسهٔ جمعآوری دادهها شاید پس از پیدا کردن «روشی برای جمعآوری اسبابسازی اسپاتیفای در مقیاس بزرگ» که «مدتی پیش» بهدست آمده بود، بسیار زیاد بود.
«ما نقش خود را در ساختن یک آرشیو موسیقی برای حفظ آن میدیدیم». جمعآوری دادههای اسپاتیفای «یک شروع عالی» بود تا به ساخت «فهرست موثقی از تورنتها که هدف آن نمایاندن تمام موسیقیهای تولید شده است» برسیم، آرشیو گفت.
آرشیو میگوید فهرستی شبیه به این «برای موسیقی وجود ندارد» و این شبیهساز LibGen خواهد بود — که توسط شرکتهای بزرگ فناوری مانند متا و استارتآپهای نظیر Anthropic برای سرقت مجموعههای کتاب بهمنظور آموزش هوش مصنوعی بهکار گرفته شد.
آرشیو آنا میگوید انتشار تورنتهای متادیتا در دسامبر امسال گامی اولین برای دستیابی به این مأموریت «حفظ» بود. گام بعدی این آرشیو انتشار تورنتهای فایلهای موسیقی است، که ابتدا با پخشهای پرطرفدار آغاز میشود و سپس بهتدریج تورنتهای آهنگهای کمتر محبوب و تصاویر آلبوم را منتشر خواهد کرد. در آینده، «اگر علاقه کافی باشد، میتوانیم امکان دانلود فایلهای منفرد را به آرشیو آنا اضافه کنیم»، این وبلاگ اعلام کرد.
اسپاتیفای به آرس اعلام کرد که برای جلوگیری از هر گونه جمعآوری غیرمجاز در آینده اقداماتی انجام میدهد.
سخنگوی اسپاتیفای گفت: «ما تدابیر جدیدی برای مقابله با این نوع حملات ضد حقنشر اجرا کردهایم و به طور فعال در حال نظارت بر رفتارهای مشکوک هستیم». او افزود: «از اولین روز با جامعهٔ هنرمندان در مقابل دزدی دیجیتال میایستیم و به طور فعال با شرکای صنعتی خود برای محافظت از خالقان و دفاع از حقوقشان همکاری میکنیم».
«این پاگلانه است»: کاربران از اینکه بهدستآوردن دادهها ممکن است آرشیو را نابود کند، میترسند
آرشیو آنا ادعا کرد که دادههای اسپاتیفای برای حفظ «میراث موسیقی بشریت» جمعآوری شدهاند و از «نابودی دائمی» بهدلیل «فاجعههای طبیعی، جنگها، کاهش بودجه و سایر بلاها» محافظت میکند.
با این حال، برخی از هواداران آرشیو آنا — که عمدتاً از این موتور جستجو برای یافتن کتابها، مقالات علمی و مقالات مجلات استفاده میکردند — از خبر جمعآوری دادههای اسپاتیفای ترسیده و نگران شدند. در Hacker News، برخی کاربران پرسیدند آیا این دادهها برای کسی جز پژوهشگران هوش مصنوعی مفید خواهد بود، چرا که جستجوی تورنتهای حجیم برای پیدا کردن آهنگهای تکتک برای طرفداران موسیقی عملی بهنظر نمیرسد.
یک کاربر اشاره کرد که «ابزارهایی وجود دارد که به طور خودکار محتوای تلویزیونی و فیلمهای سرقتشده را پیدا و به طور خودکار و بر‑تقاضی پخش میکنند». این نشان میدهد که طرفداران موسیقی ممکن است راهی برای پخش این دادهها پیدا کنند. اما دیگران نگران این بودند که آرشیو آنا ممکن است به خاطر این کار به دام افتاده باشد و خطرات قانونی را بهعهده بگیرد؛ شرکتهای هوش مصنوعی که تمایل دارند منبع دادههای آموزشی خود را مخفی کنند، بهنظر میرسد از اینچنین ریسکهایی اجتناب میکنند.
«این پاگلانه است»، یکی از نظردهندگان برتر نوشت. «قطعا میپرسم آیا این اقدام بهمنظور ارضای خواست پژوهشگران/شرکتهای هوش مصنوعی بوده است که به این اطلاعات نیاز داشتهاند یا آیا برچسبهای بزرگ موسیقی قبلاً کل کاتالوگهای خود را برای مقاصد آموزشی با هزینه ارزان ارائه میدهند؛ پس آیا این واقعاً فقط یک تلاش برای حفظ است؟»
اما آرشیو آنا واضحا برای حمایت از توسعهدهندگان هوش مصنوعی کار میکند، نظردهنده دیگری اشاره کرد که آرشیو آنا فروش «دسترسی پرسرعت» به دادههای LLM سطح سازمانی، شامل «مجموعههای ناشناخته» را ترویج میدهد. هر کسی میتواند «دهها هزار» را برای دسترسی به چنین دادهای اهدا کند، همانطور که در صفحهٔ وبسایت آن ذکر شده است، و هر پژوهشگر هوش مصنوعی میتواند برای بحث دربارهٔ «چگونه میتوانیم با هم کار کنیم» تماس بگیرد.
یک سومین نظردهنده افزود: «ممکن است هوش مصنوعی هدف اصلی یا اولیهٔ آنها نباشد، اما به وضوح همراهی میکند تا به لابراتوارهای هوش مصنوعی برای حداکثر دزدی دادهها کمک کنند».
در همین حال، در Reddit برخی نگران بودند که آرشیو آنا خود را با جمعآوری این دادهها به نابودی کشاند. برای آنها بهنظر میرسید که این آرشیو تنها «خود را هدف میگذارد» پس از اینکه شاهد مبارزهٔ کتابخانهٔ اینترنتی برای بقا در برابر حملهٔ قانونی ناشران موسیقی بودند که سال گذشته به یک تسویهحساب محرمانه منجر شد.
یکی از کاربران Reddit نوشت: «من از آرشیو AA برای قرار دادن این هدف بر دوش خود خشمگینم؛ این نفوذ اسپاتیفای فقط آرشیو ادبی واقعی مهم را نابود خواهد کرد».
در حین اینکه هواداران آرشیو آنا بههم زدن ادامه میدادند، حتی نظریهای توطئهای مطرح شد که این آرشیو «فقط برای برادران هوش مصنوعی است که هزینهٔ آن را پشت صحنه میپردازند» تا آرشیو را پایدار نگه دارند.
آرس نتوانست فوراً با آرشیو آنا برای اظهارنظر دربارهٔ نگرانی کاربران یا تحقیقات اسپاتیفای تماس بگیرد.
در Reddit، یک کاربر از این واقعیت دلگرم شد که آرشیو «بهگونهای طراحی شده است که در برابر حذف شدن مقاوم باشد»، که ممکن است از وقوع اقدام قانونی جلوگیری کند.
او توضیح داد: «دامنه و موارد مشابه میتوانند از بین بروند، اما نرمافزار اصلی و دادههای آن میتوانند بارها و بارها بازگردانده شوند».
اما همه متقاعد نشدند که آرشیو آنا میتواند با بارگذاری بیخودیقصد اینچنین حجم عظیمی از دادههای اسپاتیفای، دوام بیاورد.
یکی از کاربران هشدار داد: «این شبیه ادعای غرقنشدن تایتانیک است». او گفت که آرشیو آنا ممکن است در صورت ادامهٔ حذفهای ناشی از درخواستهای اسپاتیفای، اهدای مالی را از دست بدهد. «البته، بهنظری در تئوری دادهها میتوانند بارها بازگردند، اما هر بار این کار هزینههای مالی و منابعی دارد که محدود هستند. چند بار مردم حاضرند این کار را انجام دهند تا در نهایت دست از آن بکشند؟»
این گزارش بهمنظور افزودن بیانیهٔ اسپاتیفای بهروز شد.