Temi di ricerca dei soci

Al fine di identificare i temi su cui i soci dell’AI*IA stanno lavorando, si sono raccolti gli articoli pubblicati più di recente dai soci e sono raggruppati in cluster.

Sono stati considerati i 900 soci al 27/11/2017: per ciascuno, dalla sua pagina personale su DBLP si è individuate la pubblicazione più recente disponibile in modalità open e la si è scaricata. In totale sono state raccolte 605 pubblicazioni.

Queste sono state convertite in vettori TF/IDF (term frequency–inverse document frequency) usando la classe TfidfVectorizer di scikit-learn.

All’insieme del testo di tutte le pubblicazioni è stata poi applicata la stessa trasformazione TF/IDF e usando il vettore è stata costruita la word cloud:


che mostra l’insieme dei temi su cui i soci stanno lavorando.


Ai vettori dei documenti si è applicato il k-means clustering usando scikit-learn.

Si è scelto un numero di cluster pari a 10 e il clustering è stato eseguito 10 volte prendendo quello con score più alto. Il clustering ottenuto è stato il seguente:


Cluster

Cardinalità

Parole con maggior peso

Cluster 0

11

emotions emotion emotional mood ada moral social empathy participants book

Cluster 1

47

robot robots human 3d image robotics vision motion camera map

Cluster 2

80

logic asp answer semantics game programming let formula program player

Cluster 3

11

wikipedia word sense senses disambiguation lkif legal wsd semantic ontology

Cluster 4

67

ontology semantic owl rdf query ontologies graph web concepts dbpedia

Cluster 5

14

simulation pedestrian pedestrians traffic robots environment software vehicles dyads dynamics

Cluster 6

140

users documents text document topics social corpus words recommender semantic

Cluster 7

130

neural training networks sentiment tweets classification network dataset twitter layer

Cluster 8

53

agent agents social business artifact blockchain game network commitment users

Cluster 9

52

planning plan planner scheduling pddl actions solution traces log action


Di ciascun cluster è stata poi costruita la word cloud relativa al suo centroide, ottenendo il risultato seguente.


.


Cluster

Cardinalità

Parole con maggior peso

Cluster 0

11

emotions emotion emotional mood ada moral social empathy participants book


Cluster

Cardinalità

Parole con maggior peso

Cluster 1

47

robot robots human 3d image robotics vision motion camera map




Cluster

Cardinalità

Parole con maggior peso

Cluster 2

80

logic asp answer semantics game programming let formula program player




Cluster

Cardinalità

Parole con maggior peso

Cluster 3

11

wikipedia word sense senses disambiguation lkif legal wsd semantic ontology



Cluster

Cardinalità

Parole con maggior peso

Cluster 4

67

ontology semantic owl rdf query ontologies graph web concepts dbpedia




Cluster

Cardinalità

Parole con maggior peso

Cluster 5

14

simulation pedestrian pedestrians traffic robots environment software vehicles dyads dynamics



Cluster

Cardinalità

Parole con maggior peso

Cluster 6

140

users documents text document topics social corpus words recommender semantic


Cluster

Cardinalità

Parole con maggior peso

Cluster 7

130

neural training networks sentiment tweets classification network dataset twitter layer





Cluster

Cardinalità

Parole con maggior peso

Cluster 8

53

agent agents social business artifact blockchain game network commitment users

Cluster

Cardinalità

Parole con maggior peso

Cluster 9

52

planning plan planner scheduling pddl actions solution traces log action

Comments