L’editore automatico

Raffaele Alberto Ventura [articolo già apparso qui]

Questa è una storia bizzarra, paradossale, persino affascinante. Una storia vera dell’epoca della coda lunga, che (naturalmente) inizia sulle pagine di Amazon. Comincia con me che capito su una serie di libri dedicata ai generi musicali e capisco rapidamente, per via di una certa incoerenza nella strutturazione dei capitoli, che si tratta di compilazioni tratte da Wikipedia. In effetti l’autore indicato è proprio “fonte wikipedia”, in apparenteinfrazione della licenza CC-BY-SA con la quale sono rilasciati i contenuti dell’enciclopedia collaborativa. Digitando il nome dell’editore nel motore di Amazon, capito su altri titoli.Agricoltura (38 pp), Abati francesi (54 pp), Accordi Diplomatici Della Prima Guerra Mondiale (52 pp) o ancora Ebraismo (178 pp) o Generi cinematografici (126 pp). La grafica di copertina è sempre identica: sfondo colorato e la fotografia d’un fiore. Il prezzo, prima che Amazon li rendesse indisponibili alla vendita in Italia, era di circa dieci euro l’uno.

Ok, quindi questi prendono voci di Wikipedia e fanno dei libri. Lo facevano in America, e ora lo fanno anche in Italia. Anzi, a dire il vero lo fanno in 24 lingue, dall’arabo al cinese. Il meccanismo è trasparente, a leggere quanto scrivono nelle FAQ del loro sito: le versioni cartacee permettono di evitare la fastidiosa lettura a schermo. Anche se poi su Amazon è facile scambiarli per libri “veri”, e qualcuno rischia di portarsi a casa una voce sui racconti di Bradbury credendo che si tratti dei racconti di Bradbury. Ma tutto questo, lo ammetto, non è molto bizzarro, né tantomeno affascinante. Infatti la storia non è ancora finita.

Quanti sono i titoli prodotti con questo procedimento? Non tre, né quattro o dieci o cento: sono quindicimila solo in italiano, a partire da luglio 2011. E come li produce quindicimila libri un editore straniero, in due mesi? A casaccio. No, davvero: a casaccio. Scorrendo la lista dei titoli, appare evidente che gli elenchi di voci sono raccolti automaticamente a partire dalle categorie di Wikipedia, tra le quali persino meta-categorie proprie all’enciclopedia, che non hanno nessuna pertinenza se stampate nella forma di un libro:Da trasferire (292 pp), Pagine orfane – Letteratura (32 pp), Stub – Atletica leggera (28 pp), Pagine a cui deve essere aggiunto il template sportivo (182 pp) o lo struggente Voci mancanti di fonti (78 pagine dense e poetiche). In modo del tutto automatico dunque, e indipendentemente da ogni competenza semantica, un editore-robot ha prodotto e messo in vendita quindicimila libri, rivolti soprattutto ad acquirenti distratti. Puro Spameditoriale. Ma vediamo: in che senso l’editore ha prodotto questi libri?

Io non credo che questi libri esistano. Vincitori del National Book Award (100 pp) o Episodi di Lost (54 pp) non sono mai stati stampati né giacciono in alcun magazzino. Perlomeno questa mi pare la spiegazione più sostenibile. La probabilità di vendere un singolo libro tra questi quindicimila è molto bassa, cioè precisamente uno su quindicimila ovvero 0,006%. In fin dei conti, ognuno di questi libri equivale all’altro, e non ha in sé alcun valore intrinseco. Tuttavia, la probabilità di vendere uno qualsiasi di questi libri è già migliore. Ipotizzando che su Amazon ci siano circa trecentomila libri italiani in vendita, le probabilità salgono attorno a quindici su trecento, ovvero ben 5%. Tutto sta, dunque, nel stampare questi libri on demand, cosa che la tecnologia ha oramai reso possibile e redditizio.

Il nostro bizzarro editore automatico ha generato quindicimila esche virtuali e stamperà soltanto al momento dell’incauto acquisto. Nessun essere umano di carne e sangue sceglie e compila, nessun volume di carta attende di essere venduto. L’editore automatico è un catalogo di possibilità. In tutto il mondo, la sua strategia è inondare i siti di vendita con la sua merce avariata. E c’è da credere che il suo business model stocastico funzioni. La legge dei grandi numeri gli garantisce, dove e fino a quando la legge glielo permette, di guadagnare senza muovere un dito, lasciando che i suoi libri si producano e si vendano da soli. Se un milione di scimmie in un milione di anni finiranno per riscrivere Shakespeare, l’incontro tra un milione di patacche e un milione di potenziali acquirenti finirà per generare profitto.

Voci di fonti mancanti

Raffaele Alberto Ventura [articolo già apparso qui]

Jorge Luis Borges, non sei nessuno. Douglas Hofstadter, torna a disegnare ambigrammi. Ieri ho scoperto una cosa affascinante, e oggi se ne aggiunge un’altra che compie e corona la vicenda. Dunque c’é questo editore che copia e stampa le pagine diwikipedia, giusto? Wikipedia sapete come funziona: gli utenti collaborano e si correggono tra loro, ma alla fine l’ultima parola ce l’ha la fonte primaria cartacea, il testo pubblicato. Ebbene io non so nemmeno come dirvelo, in fondo per raccontare una cosa tanto meravigliosa le parole non ci sono, eppure é tutto vero, commovente, perfetto, simmetrico: in un centinaio di casi, wikipedia ha usato come fonti primarie proprio quei libri copiati da wikipedia.

Secondo wikipedia un certo fatto é vero perché riportato in un certo libro, nel quale é semplicemente riportata la voce di wikipedia. Questo autoriferimento incrociato é senz’altro dovuto a un’aggiunta automatica del libro alla bibliografia (da parte di un redattore di wikipedia) proprio come automatica era la creazione del libro a partire dalla pagina. Per la precisione, é probabile che il redattore non abbia mai letto il libro in questione ma ne abbia semplicemente trovato il titolo, poiché probabilmente il libronon é mai stato stampato — probabilità di essere stampato e letto che tuttavia aumenta considerevolmente quando il libro inizia ad apparire nella bibliografia di wikipedia… Insomma, nel mondo realmente ricorsivo, la realtà é il risultato di un loop infinito.

21 COMMENTS

Giacomo Verri 22 Settembre 2011 At 10:50

Davvero, o Borges, non sei nessuno! Davvero è questa la grande biblioteca di Babele! Davvero ci meritiamo questo castigo divino, questa versione degenerata, ma non troppo, dell’editoria on demand…
Sammm 22 Settembre 2011 At 13:20

Attenzione, mettendo tra virgolette la ricerca di “books llc” (ovvero escludendo tutte quelle voci di Wikipedia in cui appaiono sia la parola “book” che la parola “llc”) i risultati sono solamente 4, non più 90.
http://it.wikipedia.org/w/index.php?title=Speciale%3ARicerca&redirs=0&search=%22books+llc%22&fulltext=Search&ns0=1
Gran bell’articolo, comunque :)

Ciao!
Sascha 22 Settembre 2011 At 13:21

Ovvero, dopo anni a vantare (non tutti ma molti) i meravigliosi scenari aperti dall’editoria digitale ecco all’improvviso apparire la squallida realtà…
Raffaele 22 Settembre 2011 At 14:27

Samm: il risultato é cambiato perché wikipedia ha preso delle misure, nel frattempo (prova della loro reattività). Ma in effetti i risultati erano non un centinaio ma poche decine, per via della question che sollevi te.
Luigi B. 22 Settembre 2011 At 14:44

Gherardo,
quando tutta la “piccola editoria” italiana e la “grande editoria” in crisi faranno lo stesso, sapremo chi fu il responsabile. Tu.
Andrea Raos 22 Settembre 2011 At 18:02

Pagine orfane – Letteratura l’ho letto e non mi e’ dispiaciuto – tranne forse il finale, un po’ banalotto.

(resisto a fatica alla tentazione di copiaincollare per 15.000 volte questa frase)
gherardo bortolotti 22 Settembre 2011 At 18:10

l’episodio può essere letto in molti modi: come una specie di risultato grottesco ma secondario della cognizione collettiva, come un’estensione degli automatismi in atto nel mercato (a me ha fatto venire in mente il fatto che una percentuale significativa delle transazioni finanziarie sono gestite in automatico da algoritmi dedicati), come un segno (tra gli altri) dell’involuzione dell’industria culturale. eviterei però i toni più o meno apocalittici. per altro l’editoria on demand, quando permette di avere ristampe di testi che magari verrebbero abbandonati perché vendono una copia all’anno, a me sembra un’ottima cosa.

@luigi: nel caso spero almeno che mi sia riconosciuta una percentuale sugli utili ;-)
gherardo bortolotti 22 Settembre 2011 At 18:11

ps: ovviamente ringrazio di nuovo raffaele per la sua disponibilità a farmi postare i sui pezzi su nazione indiana.
gherardo bortolotti 22 Settembre 2011 At 18:14

@raos: è appassionante Accordi Diplomatici Della Prima Guerra Mondiale, nonostante l’inizio un po’ confuso.
nonsenepuòpiù 22 Settembre 2011 At 18:22

pazzesco

(e sarei tentat* di copincollare altre 15000 volte questo banalissimo commento, pur non essendo d’accordo con te, Andrea, su “quelle” modalità)
Andrea Raos 22 Settembre 2011 At 18:30

e’ il classico problema del romanzo di genere: troppi personaggi, troppa carne al fuoco.
andrea inglese 22 Settembre 2011 At 23:49

“voci mancanti di fonti” meriterebbe comunque lo strega!

Ma la grafica di copertina, con i fiorellini, chi l’ha decisa? Il loop, il robot, l’automatismo, l’algoritmo, il calcolo probabilistico, o qualche grigio impiegato di Amazon, in uno sperduto paesino degli USA, a Big Sur, ad esempio?
Chiappanuvoli 23 Settembre 2011 At 01:26

Fantastici. Sono dei feticci. Adesso li voglio tutti.
- jan reister 23 Settembre 2011 At 07:41
  
  Ne parla anche Maurizio Codogno di Wikimedia Italia: http://xmau.com/notiziole/arch/201109/007453.html
Raffaele 23 Settembre 2011 At 09:52

Sui fiori ho una teoria. Si tratta di un’immagine abbastanza generica, che si presta un po’ a tutto, e che ha il vantaggio di essere acquistabile in blocco come banca dati (insomma questi si sono comprati una banca dati di 15 000 fiori, o addirittura ne hanno trovata una gratuita).
Raffaele 23 Settembre 2011 At 10:06

Ho fatto una ricerca immagini invertita con google, e a quanto pare i fiori in copertina non si trovano altrove, per cui possiamo forse escludere che si tratti di una banca pubblica (peccato, sarebbe stato coerente con la loro politica). Ma forse é un limite dello strumento di ricerca.
Più interessante: si scopre che i fiori sono riutilizzati più volte, su diverse copertine! Ad esempio:
http://www.amazon.it/Concetti-Giuridici-Generali-Rappresentanza-Amministrazione/dp/1231965126/ref=sr_1_1?ie=UTF8&qid=1316764851&sr=8-1
http://www.amazon.it/Wikificare-elettronica-Beetroots-Deadmau5-Drunkenmunky/dp/1232395196
Insomma hanno comprato una banca di fiori… troppo piccola!
gherardo bortolotti 23 Settembre 2011 At 13:20

in effetti ero convinto che fossero immagini prese da flickr o dalla stessa wikipedia ma non credo sia possibile appurarlo. rimane in piedi l’ipotesi del database proprietario. ovviamente troppo piccolo: bisognava risparmiare ;-)
Giacomo Verri 23 Settembre 2011 At 19:33

Guardate un po’ questa cosa!
http://www.booksblog.it/post/5438/creare-libri-da-wikipedia
jan reister 25 Settembre 2011 At 09:34

Giacomo, è molto interessante la funzione per esporatre pagine wikipedia in formato pdf, openoffice o zim (un desktop wiki). Grazie della segnalazione.
Giacomo Verri 27 Settembre 2011 At 09:14

Grazie a te, Jan, per l’attenzione.
La fine del lavoro culturale (una tragedia borghese) /iv : eschaton 7 Ottobre 2012 At 21:40

[…] il secondo. Ma quando ci capita di scovare delle vere e proprie notizie (come quando raccontai lo strano caso dell’editore automatico) che dovremmo fare, tacere per non rubare il lavoro a Gubitosa? Se mi viene in mente una […]