瀏覽代碼

adapt zwischenbericht

genderequality-alternative
JosuaKugler 4 年之前
父節點
當前提交
56e5efa0d4
共有 2 個檔案被更改,包括 8 行新增4 行删除
  1. 二進制
      reports/zwischenbericht.pdf
  2. +8
    -4
      reports/zwischenbericht.tex

二進制
reports/zwischenbericht.pdf 查看文件


+ 8
- 4
reports/zwischenbericht.tex 查看文件

@@ -6,20 +6,24 @@
\item Website scrapen
\item Protokolle fetchen
\item Protokolle parsen
\begin{itemize}
\item Redner ermitteln
\item Redebeiträge extrahieren
\item Ordnungskommentare filtern
\item Kommentare extrahieren
\end{itemize}
\end{itemize}
\section*{Wie ist der Zustand aktuell?}
Protokolle sind heruntergeladen und geparsed in einzelnen Tabellen, die noch zusammengeführt werden müssen.
Protokolle sind heruntergeladen und geparsed in einer großen Tabelle.
Es gibt noch ein paar Issues, aber das meiste was wir haben funktioniert auch soweit.
\section*{Was muss noch gemacht werden?}
\begin{itemize}
\item Parsen verbessern (muss nicht alles gemacht werden, aber wäre vielleicht schön)
\begin{itemize}
\item Ordnungskommentare des Bundestagspräsidenten herausfiltern
\item Kommentare extrahieren und in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien
\item Kommentare in Kategorien einteilen, z.B. Kategorie Beifall mit Liste der applaudierenden Parteien
\item Metadaten vom Anfang extrahieren
\item Fehler bereinigen
\end{itemize}
\item Tabellen der einzelnen Sitzungen kombinieren zu globalen Tabellen
\item Daten auf bestimmte Fragestellungen untersuchen
\begin{itemize}
\item Wer redet am häufigsten / längsten?


Loading…
取消
儲存