| @@ -10,19 +10,19 @@ parse.R parsed einzelne Protokolle und erstellt 3 Tibbles | |||||
| ### Redner | ### Redner | ||||
| Struktur: id , vorname , nachname , fraktion , titel , rolle_kurz, rolle_lang | |||||
| Struktur: `id` , `vorname` , `nachname` , `fraktion` , `titel` , `rolle_kurz`, `rolle_lang` | |||||
| Die Rollen sind beispielsweise "Bundeskanzlerin". Leider gegendert und deshalb wahrscheinlich | Die Rollen sind beispielsweise "Bundeskanzlerin". Leider gegendert und deshalb wahrscheinlich | ||||
| nervig zu analysieren. | nervig zu analysieren. | ||||
| Wird gewonnnen aus dem _rednerliste_ Eintrag am Ende der Protokolle. | |||||
| Wird gewonnnen aus dem `<rednerliste>` Eintrag am Ende der Protokolle. | |||||
| ### Reden | ### Reden | ||||
| Struktur: id , redner | |||||
| Struktur: `id` , `redner` | |||||
| Die Reden id wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein | |||||
| _rede_ Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner | |||||
| Die Reden `id` wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein | |||||
| `<rede>` Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner | |||||
| (der der vorne am Pult steht). | (der der vorne am Pult steht). | ||||
| Innerhalb einer Rede kann es verschieden Redebeiträge geben: | Innerhalb einer Rede kann es verschieden Redebeiträge geben: | ||||
| @@ -33,21 +33,21 @@ beim parsen in der Tabelle Talks gespeichert. | |||||
| ### Talks | ### Talks | ||||
| Struktur: rede_id , redner , content | |||||
| Struktur: `rede_id` , `redner` , `content` | |||||
| Das sind die eigentlichen Redebeiträge, die innerhalb von _rede_ Einträgen auftauchen. Dabei gilt: | Das sind die eigentlichen Redebeiträge, die innerhalb von _rede_ Einträgen auftauchen. Dabei gilt: | ||||
| - rede_id: Die Rede in dem der Beitrag auftaucht | |||||
| - redner: Der Sprecher des Redebeitrags | |||||
| - content: Der Inhalt der Rede (__wichtig__: Aktuell werden die Ordnungskommentare des | |||||
| - `rede_id`: Die Rede in dem der Beitrag auftaucht | |||||
| - `redner`: Der Sprecher des Redebeitrags | |||||
| - `content`: Der Inhalt der Rede (__wichtig__: Aktuell werden die Ordnungskommentare des | |||||
| Bundestagspräsidenten nicht herausgefiltert, tauchen also im Inhalt auf, obwohl sie nicht vom | Bundestagspräsidenten nicht herausgefiltert, tauchen also im Inhalt auf, obwohl sie nicht vom | ||||
| _redner_ gesprochen werden. To be fixed!) | |||||
| `redner` gesprochen werden. To be fixed -> Issues!) | |||||
| ## Noch zu parsen: Alles kann, nichts muss. | ## Noch zu parsen: Alles kann, nichts muss. | ||||
| - Kommentare (aktuell werden nur _p_'s in Reden gesammelt). Hier ist zu überlegen, wie diese | |||||
| - Kommentare (aktuell werden nur `<p>`'s in Reden gesammelt). Hier ist zu überlegen, wie diese | |||||
| gesammelt werden sollten. | gesammelt werden sollten. | ||||
| - Meta Daten? Diese sind teilweise in den rede_id's encoded. | |||||
| - Meta Daten? Diese sind teilweise in den `rede_id`'s encoded. | |||||
| ## Kombinieren der Tabellen der Protokolle | ## Kombinieren der Tabellen der Protokolle | ||||