Open Data: the researcher perspective

open-data-report-imageL’editore Elsevier ha condotto, in collaborazione con il Centre for Science and Technology Studies (CWTS) della  Leiden University, una ricerca sulle attitudini dei ricercatori verso i dati aperti. La ricerca, che esamina le attitudini dei ricercatori verso la condivisione dei dati ed il perché di alcune loro reticenze, è composta da tre diversi studi: un’indagine globale su 1.200 ricercatori, un’analisi quantitativa sulla pubblicazione  dei dati nei data journal e tre case studies che includono interviste approfondite con individui coinvolti nella raccolta, analisi ed archiviazione di dati negli ambiti delle scienze del suolo, della genetica e dell’umanistica digitale. Per quanto riguarda l’analisi globale dei ricercatori, la ricerca presenta dei risultati interessanti:

  • non esiste un approccio generale in quanto le pratiche di condivisione dei dati dipendono dall’ambito della ricerca cui sono riferiti
  • gli atteggiamenti verso la condivisione dei dati sono generalmente positivi (il 73% afferma che sarebbe utile per la propria ricerca poter accedere a dati relativi ad articoli pubblicati, il 64% sarebbe disponibile a condividere i propri dati)
  • di contro, i dati aperti non sono ancora una realtà per una buona parte dei ricercatori: mentre la maggior parte dei ricercatori riconosce i benefici della condivisione dei dati della ricerca, pochi sono disposti a condividere dati o li hanno condivisi (34% dei ricercatori non condividono i dati relativi alla propria ricerca e meno del 15% dei i ricercatori condivide i dati in un archivio aperto).
  • ci sono ancora molti ricercatori che percepiscono i dati come una proprietà personale e quando condividono direttamente i loro dati, la maggior parte di loro (> 80%) li condivide con collaboratori diretti. Questo tipo di condivisione collaborativa, da persona a persona, suggerisce che la fiducia è un aspetto importante della condivisione dati
  • tra le varie cause della mancata, o minima, condivisione dei dati ci sono la mancanza di formazione ed il fatto che la loro condivisione non è associata ad alcuna ricompensa. Altre cause sono i problemi legati alla gestione dei dati ed ai problemi della privacy. Un dato interessante è che i data management plan richiesti dai finanziatori della ricerca non sono considerati un forte incentivo

Per quanto riguarda l’analisi quantitativa dei data journal, mentre il loro numero è ancora limitato, queste riviste giocano sempre di più un ruolo importante in termini di numero di articoli pubblicati e citazioni ricevute. In pochi anni, questo tipo di riviste assumeranno un ruolo sempre più importante nel panorama delle pubblicazioni e della ricerca scientifica. Tuttavia, dal sondaggio si ricava che la condivisione dei dati avviene ancora principalmente in modo tradizionale, come, ad esempio, con la presentazione dei dati come allegato o in tabelle, o i dati non vengono pubblicati affatto (34%).
Con questo rapporto, si è cercato di contribuire a colmare il divario tra quelle che sono le politiche sui dati aperti da una parte e le pratiche di ricerca quotidiane dall’altra. Come si è visto dai risultati della ricerca, le pratiche relative ai dati aperti sono meno sviluppate di quanto si creda, con l’eccezione degli ambiti in cui la gestione dei dati è  integrata nella struttura della ricerca dall’inizio.
Il report finale della ricerca può essere scaricato qui: i dati relativi ai tre diversi studi posso essere scaricati liberamente da Mendeley Data. 

ResearchGate scende a patti con gli editori scientifici?

resgateResearchGate (RG) ha annunciato pochi giorni fa di aver raggiunto un accordo con gli editori Springer Nature, Cambridge University Press e Thieme per collaborare alla condivisione di articoli, proteggendo sia i diritti degli autori sia degli editori, tentando di risolvere, almeno in parte, le controversie sul diritto d’autore tra la piattaforma e gli editori. L’accordo, infatti, sembra essere conseguenza della polemica dello scorso anno quando l’International Association of Scientific,Technical and Medical Publishers (STM),  aveva chiesto formalmente a RG di migliorare la comunicazione con i propri utenti sulle politiche di condivisione degli articoli alla luce del fatto che molti articoli condivisi sulla piattaforma infrangono il copyright.

L’accordo prevede un processo di notifica da parte degli editori delle violazioni del copyright a RG che a sua volta si impegna a garantire la rimozione immediata di quei contenuti. RG collaborerà inoltre con gli editori per informare i propri utenti su quale materiale possono liberamente condividere sulla piattaforma.
Gli editori avranno una maggiore consapevolezza di quando e dove il loro materiale viene condiviso, ma, secondo l’accordo, non saranno in grado di bloccare o filtrare preventivamente gli studi che vengono caricati su RG. Quest’ultima clausola ha sollevato reazioni negative da parte di altri colossi dell’editoria scientifica, in particolare Elsevier e l’American Chemical Society, che vogliono spingere RG ad assumersi la responsabilità di esaminare gli articoli prima che vengano pubblicati sulla piattaforma.

L’ultimo esperimento di Google: Talk to books

talk-to-book-Segnaliamo l’ultimo, interessante esperimento di Google relativo alla ricerca semantica e all’Intelligenza Artificiale (AI): Talk to Books. Questo strumento può essere definito come un motore di ricerca che si basa sulla capacità dell’AI di comprendere il linguaggio umano naturale.
Digitando una domanda o un’affermazione (non delle parole chiave), lo strumento esamina ogni frase negli oltre 100.000 libri archiviati in Google Books per trovare la risposta che probabilmente avrebbe dato una persona se si fosse trattato di una conversazione. La frase di risposta è mostrata in grassetto ed è riportata insieme alla parte del testo da cui è stata estrapolata in modo da fornire un contesto.
I risultati possono essere più o meno pertinenti ma l’obiettivo di Talk to Books, in questa fase iniziale, è di testare la capacità dello strumento di elaborare delle risposte che suonino come la risposta che un essere umano potrebbe dare durante una conversazione.
Al momento Talk to Books comprende solo la lingua inglese.

Kopernio e Web of Science

kopernioIl 10 aprile Clarivate Analytics ha annunciato di aver acquisito Kopernio, che a breve verrà integrato con Web of Science. Kopernio, creato nel 2017, è un plug-in già disponibile gratuitamente che rende più semplice per i ricercatori trovare gli articoli in quanto oltre a permettere di recuperare online versioni gratuite di articoli a pagamento, rileva automaticamente quali sottoscrizioni individuali o istituzionali un utente già possiede facilitando notevolmente l’accesso all’articolo.

Una delle difficoltà che spesso lamentano i ricercatori è infatti legata proprio ai complicati processi di accesso (siti diversi, troppi link) necessari per scaricare un articolo pur essendo abbonati. Uno studio del 2016 dell’Università di Utrecht ha rilevato che ben il 75% degli articoli scaricati illegalmente dai loro ricercatori attraverso Sci-Hub era accessibile legalmente grazie agli abbonamenti sottoscritti dall’università.

Questo nuovo accordo mette in evidenza la crescente consapevolezza che per combattere la pirateria nell’editoria scientifica, gli editori devono apportare modifiche radicali al modo in cui i ricercatori cercano e accedono agli articoli, migliorando l’accesso globale alla conoscenza scientifica.

L’effettiva possibilità di pubblicare in riviste ad accesso aperto

No-APCs.jpgSegnaliamo un interessante intervento sul blog di PLoS, A reality check on author access to open access publishingche discute i risultati presentati da uno studio, basato sui dati DOAJ, che afferma che il 71% delle riviste presenti nella Directory non fa pagare le APCs (Article Processing Charges) per pubblicare articoli.

L’autrice del post dichiara che  inquadrare i dati sulle riviste ad accesso aperto non a pagamento solo dal punto di vista del loro numero, senza contestualizzarle, può essere fuorviante ed anche controproducente: questo dato non dice nulla sull’effettiva disponibilità di riviste ad accesso aperto che non fanno pagare le APCs. Per dare una base alla propria affermazione, l’autrice del post, utilizzando sempre il dataset di DOAJ e partendo dal numero di riviste che dichiarano di non far pagare una APC (8.072), ha selezionato quelle che pubblicano in ambito biomedico (1.602). Restringendo successivamente la propria ricerca a quello che effettivamente interessa a coloro che vogliono pubblicare un articolo, quindi a riviste che pubblicano in inglese, che assegnano un DOI e che sono indicizzate in Medline e PubMed Central si arriva a 105 riviste (circa il 10% delle riviste indicizzate in DOAJ).

L’autrice conclude il proprio post affermando che al momento è fuorviante affermare che gli autori possono scegliere tra un gran numero di riviste che non applicano le APCs e che si potrebbero cambiare le cose se le istituzioni accademiche offrissero maggiore supporto (anche economico) al proprio personale o adottassero modelli di consorzi come l’Open Library of Humanities.

In cammino verso l’accesso aperto

PathwaystoOpenAccess

Le biblioteche della University of California hanno recentemente pubblicato un interessante documentoPathways to Open Accessper guidare la transizione dall’attuale modello di pubblicazione basato su abbonamento a modelli di finanziamento di accesso aperto (OA), al fine garantire il più ampio accesso possibile alla documentazione scientifico accademica che oggi è sempre più costosa e di difficile accesso. Il documento analizza i diversi modelli per il raggiungimento dell’accesso aperto (Green Open Access, Gold-APC e Gold-non-APC) e le strategie attuabili per sviluppare ciascun modello.
Per ogni modello di accesso aperto vengono analizzati:

  • Caratteristiche principali del modello
  • Prevalenza e impatto
  • Strategie necessarie per la sua realizzazione
  • Sfide e opportunità

Dopo aver analizzato i tre diversi modelli, il documento individua per ognuno di questi una serie di azioni concrete che le biblioteche possono intraprendere al fine di realizzare l’accesso aperto.
Il documento, nel suo complesso, rappresenta uno strumento molto concreto, una vera e propria guida che può essere utilizzata da tutte quelle istituzioni che sono interessate ad intraprendere il passaggio, anche graduale, all’accesso aperto per trasformare la comunicazione scientifico/accademica in un sistema economicamente sostenibile.

 

Le difficoltà dei ricercatori nella condivisione dei dati

negativedataresultsSpringer Nature ha appena pubblicato un White Paper dal titolo Practical challenges for researchers in data sharing che riporta i risultati di un sondaggio sulle difficoltà che incontrano i ricercatori quando decidono di condividere i dati relativi al proprio lavoro. Hanno risposto al sondaggio più di 7.700 ricercatori, di questi, il 76% pensa che sia molto importante che i propri dati siano recuperabili ed il 63% già condivide i propri dati in qualche modo (depositandoli in un archivio e/o allegandoli al documento come materiale supplementare). La principale difficoltà individuata da coloro che hanno risposto al sondaggio è l’organizzazione dei dati da archiviare (46%), seguita dalla scarsa conoscenza delle leggi relative a copyright/ licenze d’uso (37%) e degli archivi più adatti dove depositare i propri dati (33%). Altri problemi individuati sono stati la mancanza di tempo (26%) ed i costi da affrontare (19%). Anche se esistono differenze regionali, gli autori commentano i risultati del White Paper affermando che ci sono delle sfide che possono essere considerate comuni a tutti coloro che intendono condividere i dati relativi alle proprie ricerche e che richiedono quindi uno sforzo concertato. Vengono individuate due aree sulle quali lavorare per aumentare la condivisione dei dati: maggiore supporto ed informazioni sulla gestione dei dati per i ricercatori, soprattutto quelli che sono alle prime fasi della loro carriera, e percorsi facilitati per condividere i dati in modo veloce ed ottimale. Il testo del documento è caricato su Figshare ed è corredato da una chiara infografica che riassume tutti i dati più significativi del sondaggio.