Explorar el Código

adapt zwischenbericht

genderequality-alternative
JosuaKugler hace 4 años
padre
commit
56e5efa0d4
Se han modificado 2 ficheros con 8 adiciones y 4 borrados
  1. BIN
      reports/zwischenbericht.pdf
  2. +8
    -4
      reports/zwischenbericht.tex

BIN
reports/zwischenbericht.pdf Ver fichero


+ 8
- 4
reports/zwischenbericht.tex Ver fichero

@@ -6,20 +6,24 @@
\item Website scrapen
\item Protokolle fetchen
\item Protokolle parsen
\begin{itemize}
\item Redner ermitteln
\item Redebeiträge extrahieren
\item Ordnungskommentare filtern
\item Kommentare extrahieren
\end{itemize}
\end{itemize}
\section*{Wie ist der Zustand aktuell?}
Protokolle sind heruntergeladen und geparsed in einzelnen Tabellen, die noch zusammengeführt werden müssen.
Protokolle sind heruntergeladen und geparsed in einer großen Tabelle.
Es gibt noch ein paar Issues, aber das meiste was wir haben funktioniert auch soweit.
\section*{Was muss noch gemacht werden?}
\begin{itemize}
\item Parsen verbessern (muss nicht alles gemacht werden, aber wäre vielleicht schön)
\begin{itemize}
\item Ordnungskommentare des Bundestagspräsidenten herausfiltern
\item Kommentare extrahieren und in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien
\item Kommentare in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien
\item Metadaten vom Anfang extrahieren
\item Fehler bereinigen
\end{itemize}
\item Tabellen der einzelnen Sitzungen kombinieren zu globalen Tabellen
\item Daten auf bestimmte Fragestellungen untersuchen
\begin{itemize}
\item Wer redet am häufigsten / längsten?


Cargando…
Cancelar
Guardar