|
|
|
@@ -0,0 +1,61 @@ |
|
|
|
# Herunterladen |
|
|
|
|
|
|
|
Bevor analysiert werden kann, muss fetch.R ausgeführt werden, um alle Protokolle herunterzuladen. |
|
|
|
|
|
|
|
# Parsing |
|
|
|
|
|
|
|
## Tabellen |
|
|
|
|
|
|
|
parse.R parsed einzelne Protokolle und erstellt 3 Tibbles |
|
|
|
|
|
|
|
### Redner |
|
|
|
|
|
|
|
Struktur: id , vorname , nachname , fraktion , titel , rolle_kurz, rolle_lang |
|
|
|
|
|
|
|
Die Rollen sind beispielsweise "Bundeskanzlerin". Leider gegendert und deshalb wahrscheinlich |
|
|
|
nervig zu analysieren. |
|
|
|
|
|
|
|
Wird gewonnnen aus dem _rednerliste_ Eintrag am Ende der Protokolle. |
|
|
|
|
|
|
|
### Reden |
|
|
|
|
|
|
|
Struktur: id , redner |
|
|
|
|
|
|
|
Die Reden id wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein |
|
|
|
_rede_ Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner |
|
|
|
(der der vorne am Pult steht). |
|
|
|
|
|
|
|
Innerhalb einer Rede kann es verschieden Redebeiträge geben: |
|
|
|
|
|
|
|
- Kommentare: Beifall, Zwischenrufe, etc. |
|
|
|
- Redebeiträge: Typischerweise hauptsächlich der Hauptredner, aber auch Zwischenfragen. Diese werden |
|
|
|
beim parsen in der Tabelle Talks gespeichert. |
|
|
|
|
|
|
|
### Talks |
|
|
|
|
|
|
|
Struktur: rede_id , redner , content |
|
|
|
|
|
|
|
Das sind die eigentlichen Redebeiträge, die innerhalb von _rede_ Einträgen auftauchen. Dabei gilt: |
|
|
|
|
|
|
|
- rede_id: Die Rede in dem der Beitrag auftaucht |
|
|
|
- redner: Der Sprecher des Redebeitrags |
|
|
|
- content: Der Inhalt der Rede (__wichtig__: Aktuell werden die Ordnungskommentare des |
|
|
|
Bundestagspräsidenten nicht herausgefiltert, tauchen also im Inhalt auf, obwohl sie nicht vom |
|
|
|
_redner_ gesprochen werden. To be fixed!) |
|
|
|
|
|
|
|
## Noch zu parsen: Alles kann, nichts muss. |
|
|
|
|
|
|
|
- Kommentare (aktuell werden nur _p_'s in Reden gesammelt). Hier ist zu überlegen, wie diese |
|
|
|
gesammelt werden sollten. |
|
|
|
- Meta Daten? Diese sind teilweise in den rede_id's encoded. |
|
|
|
|
|
|
|
## Kombinieren der Tabellen der Protokolle |
|
|
|
|
|
|
|
- Alle Tabellen sollten schlussendlich kombiniert werden zu großen Tabellen über |
|
|
|
alle Protokolle. |
|
|
|
|
|
|
|
# Analyse |
|
|
|
|
|
|
|
- Schnittmenge AfD Vokabular und Hitler's Reden? |
|
|
|
- Redeanteile nach Geschlecht (dazu gibt es leider keine Daten in der Rednerliste), Fraktion, etc. |
|
|
|
- Ideen, Ideen, Ideen ... |