Quellcode durchsuchen

adapt zwischenbericht

genderequality-alternative
JosuaKugler vor 4 Jahren
Ursprung
Commit
56e5efa0d4
2 geänderte Dateien mit 8 neuen und 4 gelöschten Zeilen
  1. BIN
      reports/zwischenbericht.pdf
  2. +8
    -4
      reports/zwischenbericht.tex

BIN
reports/zwischenbericht.pdf Datei anzeigen


+ 8
- 4
reports/zwischenbericht.tex Datei anzeigen

@@ -6,20 +6,24 @@
\item Website scrapen
\item Protokolle fetchen
\item Protokolle parsen
\begin{itemize}
\item Redner ermitteln
\item Redebeiträge extrahieren
\item Ordnungskommentare filtern
\item Kommentare extrahieren
\end{itemize}
\end{itemize}
\section*{Wie ist der Zustand aktuell?}
Protokolle sind heruntergeladen und geparsed in einzelnen Tabellen, die noch zusammengeführt werden müssen.
Protokolle sind heruntergeladen und geparsed in einer großen Tabelle.
Es gibt noch ein paar Issues, aber das meiste was wir haben funktioniert auch soweit.
\section*{Was muss noch gemacht werden?}
\begin{itemize}
\item Parsen verbessern (muss nicht alles gemacht werden, aber wäre vielleicht schön)
\begin{itemize}
\item Ordnungskommentare des Bundestagspräsidenten herausfiltern
\item Kommentare extrahieren und in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien
\item Kommentare in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien
\item Metadaten vom Anfang extrahieren
\item Fehler bereinigen
\end{itemize}
\item Tabellen der einzelnen Sitzungen kombinieren zu globalen Tabellen
\item Daten auf bestimmte Fragestellungen untersuchen
\begin{itemize}
\item Wer redet am häufigsten / längsten?


Laden…
Abbrechen
Speichern