|
|
4 年前 | |
|---|---|---|
| R | 4 年前 | |
| hitler_texts | 4 年前 | |
| man | 4 年前 | |
| reports | 4 年前 | |
| vignettes | 4 年前 | |
| .Rbuildignore | 4 年前 | |
| .gitignore | 4 年前 | |
| DESCRIPTION | 4 年前 | |
| NAMESPACE | 4 年前 | |
| README.md | 4 年前 | |
Wie kann man entwickeln?
# alles geht mit devtools (laedt auch noch ein paar andere pakete)
library(devtools)
# neu laden aller paket funktionen
load_all()
#In CSV-files schreiben, um das laden zu beschleunigen
tables <- read_all()
tables <- repair(tables)
write_to_csv(tables)
Wir verwenden NIEMALS source, etc.! Außerdem NIEMALD library(...) verwenden, sondern um neue pakete hinzuzufuegen (als dependency), verwende:
use_package("my-good-old-package")
Um paket imports verfuegbar zu machen, muss man diese in R/hateimparlament-package.R
als @import <package> hinzufuegen.
Um dokumentationen neu zu laden / zu erstellen (ruft roxgen auf)
document()
Baue vignetten
rmarkdown::render("vignettes/bla.Rmd")
Bevor analysiert werden kann, muss fetch.R ausgeführt werden, um alle Protokolle herunterzuladen.
parse.R parsed einzelne Protokolle und erstellt 3 Tibbles
Struktur: id , vorname , nachname , fraction , titel , rolle_kurz, rolle_lang
Die Rollen sind beispielsweise “Bundeskanzlerin”. Leider gegendert und deshalb wahrscheinlich nervig zu analysieren.
Wird gewonnnen aus dem <rednerliste> Eintrag am Ende der Protokolle.
Struktur: id , redner
Die Reden id wird im Protokoll festgelegt und ist eindeutig. Eine Rede ist ein
<rede> Eintrag im Sitzungsverlauf. Eine Rede hat immer einen Hauptredner
(der der vorne am Pult steht).
Innerhalb einer Rede kann es verschieden Redebeiträge geben:
Struktur: rede_id , redner , content
Das sind die eigentlichen Redebeiträge, die innerhalb von rede Einträgen auftauchen. Dabei gilt:
rede_id: Die Rede in dem der Beitrag auftauchtredner: Der Sprecher des Redebeitragscontent: Der Inhalt der Rede (wichtig: Aktuell werden die Ordnungskommentare des
Bundestagspräsidenten nicht herausgefiltert, tauchen also im Inhalt auf, obwohl sie nicht vom
redner gesprochen werden. To be fixed -> Issues!)<p>'s in Reden gesammelt). Hier ist zu überlegen, wie diese
gesammelt werden sollten.rede_id's encoded.