diff --git a/R/parse.R b/R/parse.R index 520c211..d7fb267 100644 --- a/R/parse.R +++ b/R/parse.R @@ -153,10 +153,10 @@ parse_speech <- function(speech_xml, date) { } } else if (xml_name(node) == "kommentar") { # comments are of the form - # (blabla [Fraktion] – blabla liasdf – bla) + # (blabla [Fraktion] \u2013 blabla liasdf \u2013 bla) xml_text(node) %>% str_sub(2, -2) %>% - str_split("–") %>% + str_split("\u2013") %>% `[[`(1) %>% lapply(parse_comment, speech_id = speech_id, on_speaker = cur_speaker) -> cs diff --git a/R/repair.R b/R/repair.R index c52db56..01be4a0 100644 --- a/R/repair.R +++ b/R/repair.R @@ -64,7 +64,7 @@ repair_talks <- function(talks) { #' #' returns a lookup table lookup_speaker <- function(tb, speaker, name_variable) { - tobereplaced <- "[-–—‑­­-­­­ ]" + tobereplaced <- "[\u002D\u2013\u2014\u2011\u00AD ]" speaker %>% unite(name, prename, lastname, sep=".*") %>% mutate(name = str_replace_all(name, tobereplaced, ".*")) -> diff --git a/inst/reports/abschlussbericht.pdf b/inst/reports/abschlussbericht.pdf new file mode 100644 index 0000000..6c2804c Binary files /dev/null and b/inst/reports/abschlussbericht.pdf differ diff --git a/inst/reports/abschlussbericht.tex b/inst/reports/abschlussbericht.tex new file mode 100644 index 0000000..0b85b00 --- /dev/null +++ b/inst/reports/abschlussbericht.tex @@ -0,0 +1,16 @@ +\documentclass{article} +\usepackage[top=2.5cm, bottom=2.5cm]{geometry} + +\begin{document} + \section*{Projektbeschreibung} + Wir haben zunächst die Plenarprotokolle der 19. Wahlperiode von der Website automatisiert herunterladen lassen. + Als nächstes haben wir die Daten in ein für die Analyse sinnvolles Format gebracht, d.h. 5 Tibbles und Fehler ausgebessert. + Daraufhin konnten wir mit der Analyse beginnen. + Insbesondere + \section*{Werkzeuge aus der Vorlesung} + Wir haben, da es hauptsächlich um Datenanalyse ging, sehr viel mit tidyverse gearbeitet. + Ganz zu Beginn haben wir fürs fetchen der Protokolle rvest verwendet. + Für die Visualisierung haben wir ggplot2 sowie vignettes genutzt. + \section*{Organisation des Teams} + \section*{Meine Beteiligung} +\end{document} \ No newline at end of file