Skip to content

Termilion/deeplearning-on-twitter

Repository files navigation

Deep Learning on Twitter

Das Ziel dieser Arbeit ist die Erstellung von Embeddings für einen beliebigen Graphen unter Verwendung von DeepLearning4j und den bereits implementierten DeepWalk[2] Algorithmus. Die generierten Embeddings sollen verwendet werden, um eine Webapplikation zu realisieren, die die Ähnlichkeiten zwischen Knoten darstellt. Die Darstellung soll dabei verschiedene Aspekte betrachten, wie z.B. Darstellung aller Knoten im Vektorraum, Ähnlichkeit zwischen Knoten, Top K Knoten bzgl. eines Knotens. Als Graph soll ein Social Network Graph verwendet werden. Weiterhin soll die Ähnlichkeit zwischen Nutzern mit den The- men verglichen werden für die sie sich interessieren. Diesbezüglich sollen die Fea- tures für jeden Nutzer verwendet werden und mithilfe des ParagraphVector[1] Modell ebenfalls als Embedding dargestellt werden. Die Eingabe für das Modell sind Dokumente. In dem Fall eine Aneinanderreihung der Tags, so dass für jeden Nutzer ein Embedding generiert werden kann

Grafische Oberfläche

alt text

Benutzung

Visualisierung der Paragraph- und DeepWalk Vektoren
Wählen sie eine der 3 Actionen:

  1. GlobalView: Ansicht aller initalisierten Knoten.
  2. TopK: Zeigt die top k ähnlichsten Knoten für einen Eingabe Knoten.
  3. CompareTo: Vergleicht zwei Knoten miteinander.

Installation

git clone https://github.com/Termilion/deeplearning-on-twitter.git
cd deeplearning-on-twitter

cd data/
wget https://snap.stanford.edu/data/twitter.tar.gz
tar xzf twitter.tar.gz
wget https://snap.stanford.edu/data/twitter_combined.txt.gz
gunzip twitter_combined.txt.gz

cd ../
mvn package
java -jar target/*.jar -i data/twitter -o data -e data/twitter_combined.txt --deepwalk 400,200 --par-vec 25

Die Grafische Benutzeroberfläche und Api Dokumentation ist unter http://localhost:8080/ erreichbar.

Referenzen

  1. Q. V. Le and T. Mikolov. Distributed Representations of Sentences and Documents. 32, 2014.
  2. B. Perozzi and S. Skiena. DeepWalk : Online Learning of Social Representations Categories and Subject Descriptors.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published