|
|
|
@@ -10,19 +10,19 @@ parse.R parsed einzelne Protokolle und erstellt 3 Tibbles |
|
|
|
|
|
|
|
### Redner |
|
|
|
|
|
|
|
Struktur: id , vorname , nachname , fraktion , titel , rolle_kurz, rolle_lang |
|
|
|
Struktur: `id` , `vorname` , `nachname` , `fraktion` , `titel` , `rolle_kurz`, `rolle_lang` |
|
|
|
|
|
|
|
Die Rollen sind beispielsweise "Bundeskanzlerin". Leider gegendert und deshalb wahrscheinlich |
|
|
|
nervig zu analysieren. |
|
|
|
|
|
|
|
Wird gewonnnen aus dem _rednerliste_ Eintrag am Ende der Protokolle. |
|
|
|
Wird gewonnnen aus dem `<rednerliste>` Eintrag am Ende der Protokolle. |
|
|
|
|
|
|
|
### Reden |
|
|
|
|
|
|
|
Struktur: id , redner |
|
|
|
Struktur: `id` , `redner` |
|
|
|
|
|
|
|
Die Reden id wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein |
|
|
|
_rede_ Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner |
|
|
|
Die Reden `id` wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein |
|
|
|
`<rede>` Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner |
|
|
|
(der der vorne am Pult steht). |
|
|
|
|
|
|
|
Innerhalb einer Rede kann es verschieden Redebeiträge geben: |
|
|
|
@@ -33,21 +33,21 @@ beim parsen in der Tabelle Talks gespeichert. |
|
|
|
|
|
|
|
### Talks |
|
|
|
|
|
|
|
Struktur: rede_id , redner , content |
|
|
|
Struktur: `rede_id` , `redner` , `content` |
|
|
|
|
|
|
|
Das sind die eigentlichen Redebeiträge, die innerhalb von _rede_ Einträgen auftauchen. Dabei gilt: |
|
|
|
|
|
|
|
- rede_id: Die Rede in dem der Beitrag auftaucht |
|
|
|
- redner: Der Sprecher des Redebeitrags |
|
|
|
- content: Der Inhalt der Rede (__wichtig__: Aktuell werden die Ordnungskommentare des |
|
|
|
- `rede_id`: Die Rede in dem der Beitrag auftaucht |
|
|
|
- `redner`: Der Sprecher des Redebeitrags |
|
|
|
- `content`: Der Inhalt der Rede (__wichtig__: Aktuell werden die Ordnungskommentare des |
|
|
|
Bundestagspräsidenten nicht herausgefiltert, tauchen also im Inhalt auf, obwohl sie nicht vom |
|
|
|
_redner_ gesprochen werden. To be fixed!) |
|
|
|
`redner` gesprochen werden. To be fixed -> Issues!) |
|
|
|
|
|
|
|
## Noch zu parsen: Alles kann, nichts muss. |
|
|
|
|
|
|
|
- Kommentare (aktuell werden nur _p_'s in Reden gesammelt). Hier ist zu überlegen, wie diese |
|
|
|
- Kommentare (aktuell werden nur `<p>`'s in Reden gesammelt). Hier ist zu überlegen, wie diese |
|
|
|
gesammelt werden sollten. |
|
|
|
- Meta Daten? Diese sind teilweise in den rede_id's encoded. |
|
|
|
- Meta Daten? Diese sind teilweise in den `rede_id`'s encoded. |
|
|
|
|
|
|
|
## Kombinieren der Tabellen der Protokolle |
|
|
|
|
|
|
|
|