An R package to analyze the parliamentary records of the 19th legislative period of the Bundestag, the German parliament.
Nevar pievienot vairāk kā 25 tēmas Tēmai ir jāsākas ar burtu vai ciparu, tā var saturēt domu zīmes ('-') un var būt līdz 35 simboliem gara.
JosuaKugler 5f9343bf7f Merge branch 'master' of https://git.flavigny.de/christian/hateimparlament pirms 4 gadiem
R Merge branch 'master' of https://git.flavigny.de/christian/hateimparlament pirms 4 gadiem
hitler_texts improve german word selection pirms 4 gadiem
man add fetch_all documentation pirms 4 gadiem
reports update zwischenbericht, run documentation pirms 4 gadiem
vignettes Merge branch 'master' of https://git.flavigny.de/christian/hateimparlament pirms 4 gadiem
.Rbuildignore fix vignette pirms 4 gadiem
.gitignore correct hitler_words and start analysis pirms 4 gadiem
DESCRIPTION solve most of predefined challenges pirms 4 gadiem
NAMESPACE refactor rede -> speech, redner -> speaker pirms 4 gadiem
README.md refactor fraktion -> fraction pirms 4 gadiem

README.md

How to develop

Wie kann man entwickeln?

# alles geht mit devtools (laedt auch noch ein paar andere pakete)
library(devtools)

# neu laden aller paket funktionen
load_all()

#In CSV-files schreiben, um das laden zu beschleunigen
tables <- read_all()
tables <- repair(tables)
write_to_csv(tables)

Wir verwenden NIEMALS source, etc.! Außerdem NIEMALD library(...) verwenden, sondern um neue pakete hinzuzufuegen (als dependency), verwende:

use_package("my-good-old-package")

Um paket imports verfuegbar zu machen, muss man diese in R/hateimparlament-package.R als @import <package> hinzufuegen.

Um dokumentationen neu zu laden / zu erstellen (ruft roxgen auf)

document()

Baue vignetten

rmarkdown::render("vignettes/bla.Rmd")

Herunterladen

Bevor analysiert werden kann, muss fetch.R ausgeführt werden, um alle Protokolle herunterzuladen.

Parsing

Tabellen

parse.R parsed einzelne Protokolle und erstellt 3 Tibbles

Redner

Struktur: id , vorname , nachname , fraction , titel , rolle_kurz, rolle_lang

Die Rollen sind beispielsweise “Bundeskanzlerin”. Leider gegendert und deshalb wahrscheinlich nervig zu analysieren.

Wird gewonnnen aus dem <rednerliste> Eintrag am Ende der Protokolle.

Reden

Struktur: id , redner

Die Reden id wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein <rede> Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner (der der vorne am Pult steht).

Innerhalb einer Rede kann es verschieden Redebeiträge geben:

  • Kommentare: Beifall, Zwischenrufe, etc.
  • Redebeiträge: Typischerweise hauptsächlich der Hauptredner, aber auch Zwischenfragen. Diese werden beim parsen in der Tabelle Talks gespeichert.

Talks

Struktur: rede_id , redner , content

Das sind die eigentlichen Redebeiträge, die innerhalb von rede Einträgen auftauchen. Dabei gilt:

  • rede_id: Die Rede in dem der Beitrag auftaucht
  • redner: Der Sprecher des Redebeitrags
  • content: Der Inhalt der Rede (wichtig: Aktuell werden die Ordnungskommentare des Bundestagspräsidenten nicht herausgefiltert, tauchen also im Inhalt auf, obwohl sie nicht vom redner gesprochen werden. To be fixed -> Issues!)

Noch zu parsen: Alles kann, nichts muss.

  • Kommentare (aktuell werden nur <p>'s in Reden gesammelt). Hier ist zu überlegen, wie diese gesammelt werden sollten.
  • Meta Daten? Diese sind teilweise in den rede_id's encoded.

Kombinieren der Tabellen der Protokolle

  • Alle Tabellen sollten schlussendlich kombiniert werden zu großen Tabellen über alle Protokolle.

Analyse

  • Schnittmenge AfD Vokabular und Hitler's Reden?
  • Redeanteile nach Geschlecht (dazu gibt es leider keine Daten in der Rednerliste), Fraktion, etc.
  • Ideen, Ideen, Ideen ...