CORD-19

cord-19In risposta alla pandemia di COVID-19, l’Allen Institute for AI ha collaborato con alcuni importanti gruppi di ricerca per preparare e distribuire il COVID-19 Open Research Dataset (CORD-19), risorsa gratuita che ad oggi archivia oltre 45.000 articoli accademici, di cui oltre 33.000 con testo completo, e relativi dati, su COVID-19, SARS-CoV-2 ed i coronavirus in generale.

Questo database viene aggiornato settimanalmente, man mano che nuovi articoli vengono revisionati e pubblicati su riviste scientifiche e man mano che nuovi preprint vengono caricati su bioRxiv, medRxiv ed altri archivi ad accesso aperto.

Sul sito è possibile sia fare delle ricerche tramite il CORD-19 Explorer (abbastanza semplice, nella pagina è presente anche un elenco di strumenti che permettono una ricerca più estensiva) sia scaricare localmente tutto il set di dati per fare data e text mining, principale attrattiva del sito.

“S-legami” Open Access – Manuale d’uso per ricercatori

aprequaderniSegnaliamo l’uscita del Quaderno APRE “S-legami” Open Access – Manuale d’uso per ricercatori.
Il documento nasce nell’ambito delle attività svolte dal Gruppo di Lavoro APRE (Agenzia per la Promozione della Ricerca Europea) dedicato all’Open Science e si sviluppa come un manuale d’uso per i ricercatori sul tema Scienza Aperta e, nello specifico, su Open Access e Open Data.
La sua redazione ha coinvolto tutti i membri del Gruppo di lavoro, composto da rappresentanti delle biblioteche e degli uffici di supporto alla ricerca di diverse università e centri di ricerca italiani.
Il manuale è il prodotto finale di un lavoro che si è sviluppato in 3 fasi:

  • raccolta delle domande più comuni poste dai ricercatori in materia di Open Access e Open Data alle proprie strutture di appartenenza: biblioteche e/o grant office
  • le domande raccolte sono state suddivise in 6 temi che rappresentano le sezioni del manuale: I falsi miti, Considerazioni individuali, Peer Review e Impact Factor, La proprietà intellettuale e il contratto con l’editore, Quello che i ricercatori non sanno e Open Access e progetti europei
  • redazione delle risposte alle domande e preoccupazioni più frequenti dei ricercatori

Il manuale è di facile consultazione in quanto mantiene la struttura in domanda e risposta permettendo di individuare rapidamente le proprie perplessità e le relative risposte poste sempre in modo preciso e sintetico.

Linee guida per la selezione degli archivi di dati

open scienceL’editore Springer Nature sta collaborando con diversi editori (tra cui PLoS, F1000, Wiley, Taylor and Francis, Elsevier e Cambridge University Press), e con FAIRsharing e DataCite, per sviluppare una serie di criteri fondamentali per l’identificazione e la selezione di archivi di dati che possano essere raccomandati ai ricercatori quando intendono pubblicare i dati alla base delle proprie ricerche. 
Nella bozza di lavoro sono stati al momento elencati criteri essenziali e criteri desiderabili (non così diffusi al momento da poterli considerare come un filtro essenziale nella valutazione di un archivio di dati).
Alla base di questa collaborazione c’è la convinzione che, se si vuole che i ricercatori comincino a considerare i set di dati come risultato accademico di pari valore delle pubblicazioni di ricerca più tradizionali, editori e singole riviste dovrebbero raccomandare archivi di dati basandosi su criteri chiari e condivisi.
In questa prima fase, il lavoro è indirizzato soprattutto a editori, a riviste e a chi gestisce archivi aperti ma tutti possono andare a leggere il draft e commentarlo fino a fine gennaio 2020.

The state of Open Data 2019

stateOA2019In concomitanza con le celebrazioni della Open Access Week dello scorso ottobre, Figshare ha pubblicato il rapporto annuale The State of Open Data 2019, il quarto della serie, per esaminare le attitudini e le esperienze dei ricercatori nei riguardi della condivisione dei dati della ricerca.

Il sondaggio di quest’anno ha ricevuto un numero record di risposte, circa 8.500 (per dare un’idea della dimensione, il primo rapporto del 2016 aveva ricevuto circa 2000 risposte). La particolarità che emerge dai risultati di quest’anno è che la comunità di ricerca pensa che l’impegno degli enti che finanziano la ricerca sia fondamentale per cambiare l’atteggiamento dei ricercatori nei confronti dei dati aperti: il 67% ritiene che si debbano bloccare i finanziamenti ai ricercatori che non condividono i propri dati, o penalizzarli in altri modi, ed il 69% ritiene che gli enti che finanziano la ricerca dovrebbero rendere la condivisione dei dati di ricerca parte dei requisiti fondamentali per la concessione dei finanziamenti stessi.

Per quanto riguarda temi più generali riguardo ai dati aperti, sono ancora una buona percentuale, circa il 36%, i ricercatori che esprimono la preoccupazione che i propri dati, una volta condivisi, possano essere utilizzati in modo improprio e solo il 52% degli intervistati, che comunque condividono i propri dati, ha sentito parlare dei principi FAIR.

Un nuovo corso per bibliotecari sulla gestione dei dati

logo1-RDMLALo scorso ottobre è stato lanciato Research Data Management Librarian Academy (RDMLA), corso online gratuito per bibliotecari sulla gestione dei dati della ricerca (Research Data Management, RDM).
Il corso intende fornire ai bibliotecari le informazioni e le competenze necessarie per collaborare efficacemente con i ricercatori nella gestione dei dati ed è stato sviluppato sulla base delle risposte ad un sondaggio creato per valutare delle esigenze, e le competenze, dei professionisti dell’informazione in questo ambito. 
RDMLA è composto da otto unità di apprendimento che trattano diversi argomenti come, ad esempio, le basi della gestione dei dati di ricerca, la promozione dei servizi di gestione dei dati forniti dalle biblioteche, la gestione di progetti RDM e gli strumenti per la gestione dei dati della ricerca.

Siamo disposti a cedere i nostri dati per l’accesso aperto?

openaccessBibliosan20E’ di pochi giorni fa la notizia che Elsevier avrebbe proposto alle università olandesi, alleatesi con i centri medici universitari (NFU) e il principale finanziatore della ricerca olandese (NWO) nella trattativa con l’editore, un nuovo accordo che, se confermato, mostra un deciso cambio di strategia da parte dell’editore.
Di cosa si tratta? 
I  negoziati sono tuttora in corso, ma a far notizia è la proposta di Elsevier che dichiara di essere disposto a concedere l’accesso aperto a tutte le sue riviste, senza alcun aumento dei costi di contratto, in cambio di una piena collaborazione su una serie di progetti pilota relativi a dati e metadati
Chi beneficerebbe di questo nuovo accordo?
La notizia ha dato avvio ad un interessante scambio di opinioni su Twitter
Il timore diffuso è che accettare un accordo di questo tipo vorrebbe dire agevolare il cambio di business model da parte di Elsevier, che passerebbe dall’attuale subscription model ad uno basato sulla gestione dei dati e dei metadati, legando ulteriormente i ricercatori a sistemi e ambienti proprietari.
L’accesso ai dati della ricerca potrebbe offrire infatti ad Elsevier i mezzi per poter influenzare, in Olanda, le scelte politiche in ambito scientifico, rendendolo ancora più potente sul mercato di quanto non sia oggi.  Ad esempio, i dati sui flussi di finanziamento della ricerca potrebbero essere mappati e i dati sulla ricerca potrebbero essere utilizzati per condizionare/influenzare le scelte politiche.
Questa proposta mostra quella che probabilmente sarà la strategia futura degli editori, proiettati sempre di più verso una società dei dati per la quale offrire software e servizi per la gestione dei (meta)dati. 
I negoziati dovranno concludersi entro la fine dell’anno, sarà interessante vedere quale sarà la scelta dell’alleanza olandese.

Nuova versione di Dryad

dryadLa scorsa settimana è stato annunciato il lancio di una nuova versione di Dryad (archivio dei dati della ricerca) con funzionalità incentrate sul far sì che la pubblicazione dei dati diventi sempre più semplice per i ricercatori. 
Tra le novità segnaliamo che:

  • l’archivio ora supporta anche i set di dati inviati in modo indipendente e non solo quelli che fanno parte di un articolo inviato ad una rivista
  • i dati possono essere caricati direttamente da cloud o dal server di un laboratorio
  • i set di dati possono avere dimensioni fino a 300 GB
  • i set di dati possono essere facilmente aggiornati o modificati in qualsiasi momento
  • vengono aggiornate e visualizzate, per ogni set di dati pubblicato, le statistiche d’uso e la citazione dei dati 
  • sono state create nuove API (applicazioni che rendono più immediato l’uso di alcune funzionalità informatiche) per facilitare il lavoro sui dati

Molto interessante anche tutto il lavoro che sta facendo il gruppo di lavoro di Dryad per rendere questo archivio di dati sempre più interoperabile: 

  • integrazione con piattaforme editoriali come Editorial Manager, ScholarOne e PubSweet 
  • collaborazione con PubMed per consentire anche la ricerca dei set di dati, archiviati in Dryad, relativi agli articoli indicizzati da questa importante banca dati biomedica
  • collaborazione con Zenodo, altro importante archivio dei dati della ricerca