E-Mail: [email protected]
- Reddit ha aggiornato il file robots.txt per bloccare i crawler non autorizzati, escluso Google, con cui ha un accordo da 60 milioni di dollari.
- Il traffico di Reddit è aumentato del 39% a maggio, mentre quello di Google è calato del 2,2%, secondo dati SimilarWeb.
- Reddit ha accusato Microsoft di usare i suoi dati senza permesso per addestrare l'IA e ha richiesto accordi di licenza per l'utilizzo dei contenuti.
Reddit ha deciso di alzare la voce contro i colossi dell’intelligenza artificiale che utilizzano i suoi dati senza permesso. Steve Huffman, amministratore delegato della piattaforma, ha dichiarato in un’intervista che Microsoft, Anthropic e Perplexity si stanno comportando come se i contenuti su internet fossero gratuiti e a disposizione di tutti. Reddit ha intensificato la lotta contro i crawler, aggiornando il file robots.txt per bloccare quelli senza accordi, impedendo ai motori di ricerca come Bing di mostrare i suoi risultati.
Huffman ha sottolineato che Microsoft ha utilizzato i dati di Reddit per addestrare l’IA a riassumere contenuti nei risultati di Bing senza chiedere permesso, aggiungendo che bloccare queste compagnie è “una rottura di pal**”. Un recente accordo tra OpenAI e Reddit permette a SearchGPT di mostrare i risultati di Reddit, come modello da replicare. Con la richiesta di accordi di licenza, Reddit si unisce ad altri editori di media tradizionali che cercano di ottenere un pagamento per l’utilizzo dei contenuti nell’addestramento dell’IA generativa.
L’accusa di Reddit arriva dopo un reportage che evidenziava come Apple e altre aziende abbiano addestrato modelli di intelligenza artificiale utilizzando video di YouTube senza autorizzazione. La presa di posizione di Reddit evidenzia un cambiamento nel panorama digitale, dove la raccolta e l’utilizzo dei dati non sono più scontati. Le piattaforme online stanno cercando di proteggere i propri contenuti e ottenere un giusto compenso per il loro valore.
Reddit blocca l’accesso ai motori di ricerca
Reddit, una delle piattaforme social più popolari, sta lottando per cambiare le regole del gioco nel campo dei dati per il training dell’IA. Steve Huffman, CEO, ha lanciato un ultimatum alle aziende tech, tra cui Microsoft: pagare per accedere ai contenuti di Reddit o perdere il diritto di utilizzarli. La richiesta di Huffman arriva dopo che Reddit ha stretto accordi con Google e OpenAI per l’utilizzo dei dati.
Huffman punta il dito contro Microsoft, Anthropic e Perplexity, accusandoli di aver raccolto dati dal sito senza autorizzazione per addestrare sistemi di intelligenza artificiale o alimentare i risultati delle ricerche. “Senza accordi, non abbiamo voce in capitolo su come vengono utilizzati i nostri dati”, ha dichiarato Huffman in un’intervista. Reddit ha lanciato un ultimatum a Microsoft: pagare per sfruttare i dati della piattaforma o affrontare le conseguenze.
La tensione tra Reddit e Microsoft è evidente. Huffman accusa il gigante di Redmond di aver utilizzato i dati di Reddit per addestrare l’IA a riassumere contenuti nei risultati di Bing senza il consenso dell’azienda e degli utenti. Inoltre, sostiene che Microsoft abbia venduto i dati di Reddit ad altri motori di ricerca attraverso l’API Bing.
Reddit: l’alternativa a Google per una ricerca “autentica”
Google ha inciso profondamente sulla modalità con cui le persone cercano informazioni su internet, plasmando le abitudini di ricerca e rendendo quasi istantanea la risposta a qualsiasi domanda. Tuttavia, non è detto che il futuro sarà così. L’evoluzione delle tecnologie e le preferenze degli utenti potrebbero cambiare il modo in cui le persone accedono alle informazioni online.
La qualità delle ricerche su Google è sotto la lente. Secondo Cory Doctorow, i migliori risultati di Google sono diventati “dominati da spam, truffe e pubblicità”. Gli utenti non vanno mai oltre i primi tre o quattro risultati di ricerca su Google, e la battuta SEO “il posto migliore per nascondere un cadavere è la seconda pagina di Google” è diventata un mantra.
Internet sta lentamente cambiando. Alcuni utenti si rivolgono ai chatbot IA, altri cercano informazioni sui social network come TikTok e Instagram, e sempre più persone aggiungono “Reddit” alla fine della stringa di ricerca su Google per emergere commenti di persone reali. Reddit sta emergendo come una piattaforma per ricerche autentiche, dove i contenuti sono basati su esperienze personali e opinioni.
Un portavoce di Google ha riconosciuto questa tendenza, affermando che sempre più utenti preferiscono Reddit per ricerche specifiche. La dinamica è accentuata dall’incremento della visibilità di Reddit nei risultati di ricerca di Google. Nel mese di maggio, le visite desktop e mobile a Reddit sono aumentate del 39%, mentre quelle a Google sono calate del 2,2%, secondo dati SimilarWeb.
Reddit scompare dai motori di ricerca, tranne Google
Negli ultimi anni, Reddit ha sperimentato un importante aumento di traffico dai motori di ricerca, non solo Google, ma anche Bing, DuckDuckGo e altri. Gli utenti avevano preso l’abitudine di utilizzare la parola “Reddit” alla fine della chiave di ricerca per trovare rapidamente conversazioni riguardanti prodotti o consigli di viaggio. Ora, gli utenti dovranno abbandonare questa abitudine.
Secondo quanto riferito dal portale di informazione 404Media, Reddit ha cominciato a bloccare la scansione e l’indicizzazione del suo sito dalla maggioranza dei motori di ricerca, tutti tranne uno: Google. Questo significa che se si cerca su Bing una conversazione di Reddit di interesse, sarà impossibile reperirla, soprattutto se si tratta di tematiche recenti.
Mashable ha riferito di non aver ottenuto alcun risultato effettuando una ricerca per “site:reddit.com” sul motore di ricerca di Microsoft. Questo potrebbe non essere una novità inaspettata. Lo scorso 25 giugno, Reddit ha annunciato una modifica al suo Robots Exclusion Protocol (robots.txt), il file che controlla quali pagine del sito possono essere indicizzate e sottoposte a scansione da un motore di ricerca.
La compagnia ha dichiarato che si trattava di un’azione necessaria a fermare i bot dallo scansionare il sito, ma è probabile che ci sia qualcosa di più. Nessuno si aspettava che Reddit avrebbe tagliato fuori dal sito tutti i motori di ricerca più utilizzati dagli utenti, tranne Google. Perché soltanto il motore di ricerca di Big G può accedere alle conversazioni di Reddit e portarle sui suoi risultati di ricerca? La risposta è semplice: le due società sono fortemente legate tra loro. Qualche mese fa, hanno stipulato un accordo da 60 milioni di dollari che consente al gigante della ricerca di utilizzare i contenuti di Reddit per addestrare i suoi modelli di intelligenza artificiale.
Reddit non dipende da questo. “Blocchiamo tutti i crawler non disposti a non utilizzare i dati di scansione per la formazione sull’IA, in linea con l’applicazione della nostra politica sui contenuti pubblici e il file robots.txt aggiornato”, ha riferito un portavoce, facendo chiarezza sulla questione.
Bullet Executive Summary
In un panorama digitale in continua evoluzione, Reddit ha deciso di prendere una posizione ferma contro l’utilizzo non autorizzato dei suoi dati da parte dei giganti della tecnologia. La piattaforma ha aggiornato il suo file robots.txt per bloccare i crawler non autorizzati, ad eccezione di Google, con cui ha stipulato un accordo da 60 milioni di dollari. Questa mossa riflette un cambiamento più ampio nel settore, dove le piattaforme online cercano di proteggere i propri contenuti e ottenere un giusto compenso per il loro valore.
La questione solleva importanti riflessioni sul futuro della ricerca online e sull’equilibrio tra l’innovazione tecnologica e la protezione dei dati. Mentre Google rimane insostituibile per molte ricerche, Reddit offre una dimensione umana e autentica che manca nei risultati di Google. La coesistenza di queste due piattaforme rappresenta una nuova frontiera nella ricerca online, unendo l’affidabilità dei risultati di Google con la genuinità delle opinioni su Reddit.
In conclusione, la battaglia di Reddit contro i giganti dell’IA è un chiaro segnale che il panorama digitale sta cambiando. Le piattaforme online stanno diventando sempre più consapevoli del valore dei loro dati e sono pronte a difenderli con forza. Questo cambiamento potrebbe portare a un futuro in cui la qualità e l’autenticità dei contenuti saranno premiate, a beneficio di tutti gli utenti.