flavis 4 лет назад
Родитель
Сommit
27a92e54b8
1 измененных файлов: 12 добавлений и 12 удалений
  1. +12
    -12
      README.md

+ 12
- 12
README.md Просмотреть файл

@@ -10,19 +10,19 @@ parse.R parsed einzelne Protokolle und erstellt 3 Tibbles


### Redner ### Redner


Struktur: id , vorname , nachname , fraktion , titel , rolle_kurz, rolle_lang
Struktur: `id` , `vorname` , `nachname` , `fraktion` , `titel` , `rolle_kurz`, `rolle_lang`


Die Rollen sind beispielsweise "Bundeskanzlerin". Leider gegendert und deshalb wahrscheinlich Die Rollen sind beispielsweise "Bundeskanzlerin". Leider gegendert und deshalb wahrscheinlich
nervig zu analysieren. nervig zu analysieren.


Wird gewonnnen aus dem _rednerliste_ Eintrag am Ende der Protokolle.
Wird gewonnnen aus dem `<rednerliste>` Eintrag am Ende der Protokolle.


### Reden ### Reden


Struktur: id , redner
Struktur: `id` , `redner`


Die Reden id wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein
_rede_ Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner
Die Reden `id` wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein
`<rede>` Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner
(der der vorne am Pult steht). (der der vorne am Pult steht).


Innerhalb einer Rede kann es verschieden Redebeiträge geben: Innerhalb einer Rede kann es verschieden Redebeiträge geben:
@@ -33,21 +33,21 @@ beim parsen in der Tabelle Talks gespeichert.


### Talks ### Talks


Struktur: rede_id , redner , content
Struktur: `rede_id` , `redner` , `content`


Das sind die eigentlichen Redebeiträge, die innerhalb von _rede_ Einträgen auftauchen. Dabei gilt: Das sind die eigentlichen Redebeiträge, die innerhalb von _rede_ Einträgen auftauchen. Dabei gilt:


- rede_id: Die Rede in dem der Beitrag auftaucht
- redner: Der Sprecher des Redebeitrags
- content: Der Inhalt der Rede (__wichtig__: Aktuell werden die Ordnungskommentare des
- `rede_id`: Die Rede in dem der Beitrag auftaucht
- `redner`: Der Sprecher des Redebeitrags
- `content`: Der Inhalt der Rede (__wichtig__: Aktuell werden die Ordnungskommentare des
Bundestagspräsidenten nicht herausgefiltert, tauchen also im Inhalt auf, obwohl sie nicht vom Bundestagspräsidenten nicht herausgefiltert, tauchen also im Inhalt auf, obwohl sie nicht vom
_redner_ gesprochen werden. To be fixed!)
`redner` gesprochen werden. To be fixed -> Issues!)


## Noch zu parsen: Alles kann, nichts muss. ## Noch zu parsen: Alles kann, nichts muss.


- Kommentare (aktuell werden nur _p_'s in Reden gesammelt). Hier ist zu überlegen, wie diese
- Kommentare (aktuell werden nur `<p>`'s in Reden gesammelt). Hier ist zu überlegen, wie diese
gesammelt werden sollten. gesammelt werden sollten.
- Meta Daten? Diese sind teilweise in den rede_id's encoded.
- Meta Daten? Diese sind teilweise in den `rede_id`'s encoded.


## Kombinieren der Tabellen der Protokolle ## Kombinieren der Tabellen der Protokolle




Загрузка…
Отмена
Сохранить