flavis 4 лет назад
Родитель
Сommit
27a92e54b8
1 измененных файлов: 12 добавлений и 12 удалений
  1. +12
    -12
      README.md

+ 12
- 12
README.md Просмотреть файл

@@ -10,19 +10,19 @@ parse.R parsed einzelne Protokolle und erstellt 3 Tibbles

### Redner

Struktur: id , vorname , nachname , fraktion , titel , rolle_kurz, rolle_lang
Struktur: `id` , `vorname` , `nachname` , `fraktion` , `titel` , `rolle_kurz`, `rolle_lang`

Die Rollen sind beispielsweise "Bundeskanzlerin". Leider gegendert und deshalb wahrscheinlich
nervig zu analysieren.

Wird gewonnnen aus dem _rednerliste_ Eintrag am Ende der Protokolle.
Wird gewonnnen aus dem `<rednerliste>` Eintrag am Ende der Protokolle.

### Reden

Struktur: id , redner
Struktur: `id` , `redner`

Die Reden id wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein
_rede_ Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner
Die Reden `id` wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein
`<rede>` Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner
(der der vorne am Pult steht).

Innerhalb einer Rede kann es verschieden Redebeiträge geben:
@@ -33,21 +33,21 @@ beim parsen in der Tabelle Talks gespeichert.

### Talks

Struktur: rede_id , redner , content
Struktur: `rede_id` , `redner` , `content`

Das sind die eigentlichen Redebeiträge, die innerhalb von _rede_ Einträgen auftauchen. Dabei gilt:

- rede_id: Die Rede in dem der Beitrag auftaucht
- redner: Der Sprecher des Redebeitrags
- content: Der Inhalt der Rede (__wichtig__: Aktuell werden die Ordnungskommentare des
- `rede_id`: Die Rede in dem der Beitrag auftaucht
- `redner`: Der Sprecher des Redebeitrags
- `content`: Der Inhalt der Rede (__wichtig__: Aktuell werden die Ordnungskommentare des
Bundestagspräsidenten nicht herausgefiltert, tauchen also im Inhalt auf, obwohl sie nicht vom
_redner_ gesprochen werden. To be fixed!)
`redner` gesprochen werden. To be fixed -> Issues!)

## Noch zu parsen: Alles kann, nichts muss.

- Kommentare (aktuell werden nur _p_'s in Reden gesammelt). Hier ist zu überlegen, wie diese
- Kommentare (aktuell werden nur `<p>`'s in Reden gesammelt). Hier ist zu überlegen, wie diese
gesammelt werden sollten.
- Meta Daten? Diese sind teilweise in den rede_id's encoded.
- Meta Daten? Diese sind teilweise in den `rede_id`'s encoded.

## Kombinieren der Tabellen der Protokolle



Загрузка…
Отмена
Сохранить