#Test
Hallo ich teste das gerade
Bevor analysiert werden kann, muss fetch.R ausgeführt werden, um alle Protokolle herunterzuladen.
parse.R parsed einzelne Protokolle und erstellt 3 Tibbles
Struktur: id , vorname , nachname , fraktion , titel , rolle_kurz, rolle_lang
Die Rollen sind beispielsweise “Bundeskanzlerin”. Leider gegendert und deshalb wahrscheinlich nervig zu analysieren.
Wird gewonnnen aus dem <rednerliste> Eintrag am Ende der Protokolle.
Struktur: id , redner
Die Reden id wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein
<rede> Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner
(der der vorne am Pult steht).
Innerhalb einer Rede kann es verschieden Redebeiträge geben:
Struktur: rede_id , redner , content
Das sind die eigentlichen Redebeiträge, die innerhalb von rede Einträgen auftauchen. Dabei gilt:
rede_id: Die Rede in dem der Beitrag auftauchtredner: Der Sprecher des Redebeitragscontent: Der Inhalt der Rede (wichtig: Aktuell werden die Ordnungskommentare des
Bundestagspräsidenten nicht herausgefiltert, tauchen also im Inhalt auf, obwohl sie nicht vom
redner gesprochen werden. To be fixed -> Issues!)<p>'s in Reden gesammelt). Hier ist zu überlegen, wie diese
gesammelt werden sollten.rede_id's encoded.