diff --git a/.gitignore b/.gitignore index 44e9580..1373f18 100644 --- a/.gitignore +++ b/.gitignore @@ -1,3 +1,6 @@ *.xml /doc/ /Meta/ +/reports/ +!/reports/*.pdf +!/reports/*.tex diff --git a/DESCRIPTION b/DESCRIPTION index 0ec52b1..71133cb 100644 --- a/DESCRIPTION +++ b/DESCRIPTION @@ -17,6 +17,7 @@ RoxygenNote: 7.1.1 Imports: dplyr, pbapply, + purrr, rvest, stringr, tibble, diff --git a/NAMESPACE b/NAMESPACE index 1730b96..7fe3834 100644 --- a/NAMESPACE +++ b/NAMESPACE @@ -5,6 +5,7 @@ export(read_all) export(repair) import(dplyr) import(pbapply) +import(purrr) import(stringr) import(tibble) import(utils) diff --git a/R/hateimparlament-package.R b/R/hateimparlament-package.R index b2006dd..542609b 100644 --- a/R/hateimparlament-package.R +++ b/R/hateimparlament-package.R @@ -6,6 +6,7 @@ #' @import stringr #' @import xml2 #' @import utils +#' @import purrr #' @keywords internal "_PACKAGE" diff --git a/reports/zwischenbericht.pdf b/reports/zwischenbericht.pdf new file mode 100644 index 0000000..491550d Binary files /dev/null and b/reports/zwischenbericht.pdf differ diff --git a/reports/zwischenbericht.tex b/reports/zwischenbericht.tex new file mode 100644 index 0000000..bbcb6cb --- /dev/null +++ b/reports/zwischenbericht.tex @@ -0,0 +1,47 @@ +\documentclass{article} +\usepackage[top=2.5cm, bottom=2.5cm]{geometry} + +\begin{document} + \section*{Was wurde bisher gemacht?} + \begin{itemize} + \item Website scrapen + \item Protokolle fetchen + \item Protokolle parsen + \begin{itemize} + \item Redner ermitteln + \item Redebeiträge extrahieren + \item Ordnungskommentare filtern + \item Kommentare extrahieren + \item Fehler in Redner Tabelle bereinigen + \end{itemize} + \end{itemize} + \section*{Wie ist der Zustand aktuell?} + Protokolle sind heruntergeladen und geparsed in einer großen Tabelle. + Es gibt noch ein paar Issues, aber das meiste was wir haben funktioniert auch soweit. + \section*{Was muss noch gemacht werden?} + \begin{itemize} + \item Parsen verbessern (muss nicht alles gemacht werden, aber wäre vielleicht schön) + \begin{itemize} + \item Kommentare in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien + \item Metadaten vom Anfang extrahieren + \item Fehler weiter bereinigen (in talks, reden) + \end{itemize} + \item Error Handling beim Fetchen + \item Daten auf bestimmte Fragestellungen untersuchen + \begin{itemize} + \item Wer redet am häufigsten / längsten? + \item Was ist typisches Vokabular für einzelne Fraktionen? + \item Welche Fraktion gibt / bekommt den meisten Beifall / die meisten Zwischenrufe? + \item Ab wann wird Pandemie-Vokabular (Virus, Corona, Maske, $\dots$ ) genutzt? + \item Hat die Pandemie andere Themen wie Klimawandel verdrängt? + \end{itemize} + \item Ergebnisse visualisieren + \end{itemize} + \section*{Wie sieht der Plan für die nächsten Wochen aus?} + \begin{itemize} + \item[-24.07.] Klausurenphase + \item[25.07.-31.07.] Datenanalyse + \item[01.08.-07.08.] Visualisierung, Bugfixes und Improvements + \item[08.08.-11.08.] Präsentation machen + \end{itemize} +\end{document} \ No newline at end of file