Docs: AGENTS.md mit CLAUDE.md konsolidiert und Einzeldatei entfernt

Code-Style-Richtlinien (Imports, Type Annotations, Naming, Logging, Docstrings), UI-Import-Pattern, Thread-Pattern, RAM-Optimierung und Test-Infos aus AGENTS.md übernommen. Veraltete Einträge korrigiert (qdarktheme entfernt, _execute_sql_query → DatabaseQueryThread, XslDependencyDialog dokumentiert). Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-21 15:25:10 +01:00
parent 3dcbf783b1
commit 64408157ba
2 changed files with 350 additions and 549 deletions
@@ -1,365 +0,0 @@
-# AGENTS.md
-
-**Entwicklerrichtlinien für DocuMentor (KI-Coding-Agenten)**
-
-Diese Datei enthält wichtige Richtlinien für Coding-Agenten, die in diesem Repository arbeiten.
-
-## Sprache
-
-**Alle Kommunikation, Code-Kommentare und UI-Texte auf Deutsch!**
- Kommentare: Deutsch
- Docstrings: Deutsch
- Log-Meldungen: Deutsch
- Variablennamen: Deutsch wo kontextuell passend
- UI-Labels: Deutsch
-
-## Build & Lint Kommandos
-
-### Paketmanager: `uv` (NICHT pip oder poetry!)
-
-```bash
-# Abhängigkeiten installieren
-uv sync
-
-# Anwendung starten
-uv run python src/main.py
-
-# Code-Style prüfen (Zeilenlänge: 120)
-uv run ruff check
-
-# Code automatisch formatieren
-uv run ruff format
-```
-
-### Tests ausführen
-
-```bash
-# Alle Hash-Tests
-uv run python test_hash_implementation.py
-
-# Duplikatserkennung testen
-uv run python test_xml_hash_duplicate_detection.py
-
-# Einzelnen Test ausführen (direkter Python-Aufruf)
-uv run python test_hash_implementation.py
-```
-
-**Hinweis:** Dieses Projekt verwendet KEINE pytest/unittest-Frameworks. Tests sind standalone Python-Skripte mit if __name__ == "__main__".
-
-## Code-Style-Richtlinien
-
-### Import-Organisation
-
-**Reihenfolge (keine Leerzeilen zwischen Gruppen):**
-
-```python
-# 1. Standard Library
-import os
-import sys
-import logging
-from pathlib import Path
-from typing import Optional, TYPE_CHECKING
-
-# 2. Drittanbieter (Third-Party)
-from PySide6.QtCore import Qt, QThread, Signal
-from PySide6.QtWidgets import QDialog, QMainWindow
-from pydantic import BaseModel, Field
-
-# 3. Lokale Imports (IMMER absolute Imports, KEINE relativen .imports)
-from conf import app_settings, TreeNode, XslFile
-from ui.MainWindow import MainWindow
-from ui.JavaVmConfigDialog_ui import Ui_JavaVmConfigDialog
-```
-
-**Wichtig:**
- Immer `from pathlib import Path` verwenden
- NIEMALS String-Pfade verwenden, IMMER `Path`-Objekte
- `TYPE_CHECKING` für zirkuläre Import-Vermeidung nutzen
- Keine relativen Imports (`.` oder `..`)
-
-### Type Annotations
-
-**Moderne Union-Syntax verwenden:**
-
-```python
-# RICHTIG
-def transform(xml_path: Path, params: dict[str, str]) -> tuple[bool, str]:
-    result: str | None = None
-    files: list[Path] = []
-    
-# FALSCH
-def transform(xml_path, params):  # Keine Annotations
-    result: Optional[str] = None  # Alte Union-Syntax
-    files: List[Path] = []  # Großgeschriebene Types
-```
-
-**Pflicht:**
- Alle Funktionsparameter annotieren
- Alle Rückgabewerte annotieren
- Moderne Syntax: `str | None` statt `Optional[str]`
- Container: `list[str]`, `dict[str, str]`, `tuple[int, int]`
-
-### Naming Conventions
-
-```python
-# Klassen: PascalCase
-class SaxonWorkerPool:
-class TransformationJob:
-
-# Funktionen/Methoden: snake_case
-def transform_saxon(xml_file: Path) -> bool:
-def calculate_hash(content: bytes) -> str:
-
-# Private Methoden: _snake_case mit Unterstrich
-def _create_tree_item(self, node: TreeNode):
-def _load_project_data(self):
-
-# Variablen: snake_case
-xml_file_path = Path("test.xml")
-diff_pdf_count = 0
-self.current_zoom = 100
-
-# Konstanten: UPPER_CASE
-SAXON_WORKER_JAVA = """..."""
-MAX_RETRY_COUNT = 3
-```
-
-### Formatierung & Linting
-
- **Zeilenlänge:** 120 Zeichen (via Ruff konfiguriert)
- **Strings:** Bevorzugt Double-Quotes `"..."`, aber konsistent im File
- **Trailing Commas:** Bei mehrzeiligen Strukturen verwenden
- **Ruff:** Alle Warnings beheben vor Commit
-
-### Error Handling
-
-**IMMER Logging statt print() verwenden:**
-
-```python
-import logging
-
-logger = logging.getLogger(__name__)
-
-def transform(xml_path: Path) -> tuple[bool, str]:
-    try:
-        # Operation durchführen
-        logger.info(f"Transformation gestartet: {xml_path}")
-        result = do_transform(xml_path)
-        logger.debug(f"Zwischenergebnis: {result}")
-        return True, "Erfolg"
-        
-    except FileNotFoundError as e:
-        error_msg = f"XML-Datei nicht gefunden: {xml_path}"
-        logger.error(error_msg)
-        return False, error_msg
-        
-    except Exception as e:
-        error_msg = f"Fehler bei Transformation: {str(e)}"
-        logger.exception(error_msg)  # Mit Stack Trace
-        return False, error_msg
-```
-
-**Pattern:**
- `logger.debug()` für Debugging-Infos
- `logger.info()` für normale Operationen
- `logger.warning()` für Warnungen
- `logger.error()` für Fehler ohne Stack Trace
- `logger.exception()` für Fehler MIT Stack Trace
- Fehlermeldungen auf Deutsch
-
-### Docstrings
-
-**Google-Style auf Deutsch:**
-
-```python
-def transform_xml_to_pdf(xml_path: Path, xsl_path: Path, output_dir: Path) -> tuple[bool, str]:
-    """
-    Transformiert eine XML-Datei mit XSL zu PDF.
-
-    Args:
-        xml_path: Pfad zur XML-Eingabedatei
-        xsl_path: Pfad zum XSL-Stylesheet
-        output_dir: Zielverzeichnis für PDF-Ausgabe
-
-    Returns:
-        tuple[bool, str]: (Erfolg, Fehlermeldung oder Info-Text)
-
-    Raises:
-        FileNotFoundError: Wenn XML- oder XSL-Datei nicht existiert
-    """
-```
-
-**Modul-Docstrings am Dateianfang:**
-
-```python
-"""
-Saxon Worker Pool - Persistente JVM-Prozesse für schnelle XSLT-Transformationen.
-
-Eliminiert JVM-Startup-Overhead durch Vorinitialisierung von N Worker-Prozessen.
-Verwendet multiprocessing.Queue für Thread-sichere Kommunikation.
-"""
-```
-
-## Pydantic Models
-
-### Definition
-
-```python
-from pydantic import BaseModel, Field
-
-class Project(BaseModel):
-    id: int = Field(..., description="Eindeutige Projekt-ID", gt=0)
-    name: str = Field(..., description="Projekt-Name", min_length=1, max_length=255)
-    project_dir: Path = Field(..., description="Pfad zum Projekt-Verzeichnis")
-    
-    # Helper-Methoden direkt im Model erlaubt
-    def getJavaVm(self) -> str:
-        global app_settings
-        value = [x.version for x in app_settings.java_vms if x.id == self.java_vm_id]
-        return value[0] if len(value) else ""
-```
-
-### Settings speichern
-
-```python
-from conf import app_settings, ProjectData
-
-# Globale Einstellungen
-app_settings.theme = "Fusion"
-app_settings.save()  # WICHTIG: Nicht vergessen!
-
-# Projekteinstellungen
-project_data = ProjectData.readSettings(project_dir)
-project_data.nodes.append(new_node)
-project_data.writeSettings(project_dir)  # WICHTIG: Persistieren!
-```
-
-## PySide6 UI-Integration
-
-### KRITISCH: UI-Dateien nicht manuell bearbeiten!
-
-```
-src/ui/
-├── MainWindow.ui          # Qt Designer Datei (editieren erlaubt)
-├── MainWinddow_ui.py      # AUTO-GENERIERT (NICHT BEARBEITEN!)
-└── MainWindow.py          # Implementierung (hier Code schreiben)
-```
-
-### UI-Import-Pattern
-
-```python
-# In src/ui/JavaVmConfigDialog.py
-from PySide6.QtWidgets import QDialog
-from ui.JavaVmConfigDialog_ui import Ui_JavaVmConfigDialog
-
-class JavaVmConfigDialog(QDialog):
-    def __init__(self, parent=None):
-        super().__init__(parent)
-        
-        # UI einrichten
-        self.ui = Ui_JavaVmConfigDialog()
-        self.ui.setupUi(self)
-        
-        # Signale NACH setupUi() verbinden
-        self.ui.browseButton.clicked.connect(self._browse_file)
-        
-    def _browse_file(self):
-        # Widgets über self.ui.widgetName zugreifen
-        current_path = self.ui.pathLineEdit.text()
-        ...
-```
-
-**Wichtig:**
- UI-Klassen NIEMALS direkt erben, nur als `self.ui` Member
- Alle Widgets über `self.ui.widgetName` zugreifen
- Signal-Verbindungen immer NACH `setupUi()` aufrufen
-
-## Projektstruktur-Änderungen
-
-Beim Modifizieren der Baumstruktur (TreeNode, XslFile, XmlFile):
-
-```python
-# 1. ProjectData modifizieren
-self.project_data.nodes.append(new_node)
-
-# 2. SOFORT persistieren
-self.project_data.writeSettings(self.project.project_dir)
-
-# 3. UI neu laden
-self._load_nodes_to_tree()
-```
-
-**Pattern:** Immer in dieser Reihenfolge: Modifizieren → Speichern → UI aktualisieren
-
-## Wichtige Konventionen
-
-### Pathlib IMMER verwenden
-
-```python
-# RICHTIG
-from pathlib import Path
-
-xml_path = Path("data/test.xml")
-xml_path = Path.home() / ".config" / "app" / "config.json"
-xml_path = Path(os.path.expandvars("$HOME/data")).expanduser()
-
-if xml_path.exists():
-    content = xml_path.read_text(encoding="utf-8")
-
-# FALSCH
-xml_path = "data/test.xml"  # String-Pfad
-xml_path = os.path.join("data", "test.xml")  # os.path statt pathlib
-```
-
-### Globale Singletons
-
-```python
-# In conf.py am Modulende
-app_settings = AppSettings()
-
-# In anderen Modulen
-from conf import app_settings
-
-# Verwendung
-java_vm = [x for x in app_settings.java_vms if x.id == vm_id][0]
-```
-
-### Thread-basierte Operationen
-
-```python
-from PySide6.QtCore import QThread, Signal
-
-class HashCalculatorThread(QThread):
-    # Signale für Thread-sichere Kommunikation
-    progress = Signal(int)
-    finished = Signal(dict)
-    
-    def __init__(self, files: list[Path]):
-        super().__init__()
-        self.files = files
-        
-    def run(self):
-        for i, file_path in enumerate(self.files):
-            hash_value = calculate_hash(file_path)
-            self.progress.emit(i + 1)
-        self.finished.emit(results)
-
-# Verwendung
-thread = HashCalculatorThread(xml_files)
-thread.progress.connect(self._on_progress)
-thread.finished.connect(self._on_finished)
-thread.start()  # NICHT run() direkt aufrufen!
-```
-
-## RAM-Optimierung
-
-Da DocuMentor permanent läuft, sparsam mit RAM umgehen:
-
- Worker-Pools nach Verwendung herunterfahren
- Große Datenstrukturen frühzeitig freigeben
- Polars DataFrames statt Pandas (geringerer RAM-Verbrauch)
- Lazy Loading wo möglich
-
---
-
-**Zusammenfassung:** Deutsch sprechen, pathlib verwenden, Typen annotieren, Ruff nutzen, UI-Dateien nicht anfassen!
@@ -19,13 +19,11 @@ Die Basis bilden etwa 100 XSL-Dateien. Die meisten sind mittels `<xsl:import/>`

 Diese Schritte können sich mehrfach wiederholen.

-Da der DocuMentor permanent im Hintergrund läuft, ist ein sparsamer Umgang mit RAM wichtig.
-
-## PySide6-GUI
- Beim Erstellen neuer Dialoge und Fenster sollte immer eine entsprechende UI-Datei erstellt werden
- Der Entwickler sollte später in der Lage sein, den neuen Dialog bzw. Fenster über diese UI-Datei zu gestalten
- Aus der UI-Datei wird in Visual Studio Code über eine Erweiterung automatisch eine .py-Datei erzeugt
- Die automatisch generierte .py-Datei muss in den Code eingebunden und verwendet werden
+Da der DocuMentor permanent im Hintergrund läuft, ist ein sparsamer Umgang mit RAM wichtig:
+- Worker-Pools nach Verwendung herunterfahren
+- Große Datenstrukturen frühzeitig freigeben
+- Polars DataFrames statt Pandas (geringerer RAM-Verbrauch)
+- Lazy Loading wo möglich

 ## Entwicklungskommandos

@@ -34,7 +32,6 @@ Dieses Projekt verwendet den `uv` Paketmanager (nicht pip oder poetry):
 ```bash
 uv sync                    # Abhängigkeiten installieren
 uv run python src/main.py  # Anwendung starten
-uv run python test_hash_implementation.py  # Hash-Tests ausführen
 ```

 ### Linting
@@ -43,6 +40,130 @@ uv run ruff check         # Code-Style prüfen (Zeilenlänge: 120)
 uv run ruff format        # Code formatieren
 ```

+### Tests
+Dieses Projekt verwendet KEINE pytest/unittest-Frameworks. Tests sind standalone Python-Skripte:
+```bash
+uv run python test_hash_implementation.py           # Hash-Tests
+uv run python test_xml_hash_duplicate_detection.py  # Duplikatserkennung
+```
+
+## Code-Style-Richtlinien
+
+### Import-Organisation
+
+Reihenfolge (keine Leerzeilen zwischen Gruppen):
+```python
+# 1. Standard Library
+import os
+import sys
+import logging
+from pathlib import Path
+from typing import TYPE_CHECKING
+
+# 2. Drittanbieter
+from PySide6.QtCore import Qt, QThread, Signal
+from PySide6.QtWidgets import QDialog, QMainWindow
+from pydantic import BaseModel, Field
+
+# 3. Lokale Imports (IMMER absolute Imports, KEINE relativen .imports)
+from conf import app_settings, TreeNode, XslFile
+from ui.MainWindow import MainWindow
+```
+
+- `TYPE_CHECKING` für zirkuläre Import-Vermeidung nutzen
+- Keine relativen Imports (`.` oder `..`)
+
+### Type Annotations
+
+Moderne Union-Syntax verwenden:
+```python
+# RICHTIG
+def transform(xml_path: Path, params: dict[str, str]) -> tuple[bool, str]:
+    result: str | None = None
+    files: list[Path] = []
+
+# FALSCH
+def transform(xml_path, params):  # Keine Annotations
+    result: Optional[str] = None  # Alte Union-Syntax
+    files: List[Path] = []  # Großgeschriebene Types
+```
+
+### Naming Conventions
+
+```python
+# Klassen: PascalCase
+class SaxonWorkerPool:
+
+# Funktionen/Methoden: snake_case
+def transform_saxon(xml_file: Path) -> bool:
+
+# Private Methoden: _snake_case mit Unterstrich
+def _create_tree_item(self, node: TreeNode):
+
+# Konstanten: UPPER_CASE
+SAXON_WORKER_JAVA = """..."""
+```
+
+### Formatierung
+- **Zeilenlänge:** 120 Zeichen (via Ruff konfiguriert)
+- **Strings:** Bevorzugt Double-Quotes `"..."`, aber konsistent im File
+- **Trailing Commas:** Bei mehrzeiligen Strukturen verwenden
+
+### Error Handling
+
+IMMER Logging statt `print()` verwenden:
+```python
+import logging
+logger = logging.getLogger(__name__)
+
+def transform(xml_path: Path) -> tuple[bool, str]:
+    try:
+        logger.info(f"Transformation gestartet: {xml_path}")
+        result = do_transform(xml_path)
+        return True, "Erfolg"
+    except FileNotFoundError as e:
+        error_msg = f"XML-Datei nicht gefunden: {xml_path}"
+        logger.error(error_msg)
+        return False, error_msg
+    except Exception as e:
+        error_msg = f"Fehler bei Transformation: {str(e)}"
+        logger.exception(error_msg)  # Mit Stack Trace
+        return False, error_msg
+```
+
+- `logger.debug()` für Debugging-Infos
+- `logger.info()` für normale Operationen
+- `logger.warning()` für Warnungen
+- `logger.error()` für Fehler ohne Stack Trace
+- `logger.exception()` für Fehler MIT Stack Trace
+- Fehlermeldungen auf Deutsch
+
+### Docstrings
+
+Google-Style auf Deutsch:
+```python
+def transform_xml_to_pdf(xml_path: Path, xsl_path: Path, output_dir: Path) -> tuple[bool, str]:
+    """
+    Transformiert eine XML-Datei mit XSL zu PDF.
+
+    Args:
+        xml_path: Pfad zur XML-Eingabedatei
+        xsl_path: Pfad zum XSL-Stylesheet
+        output_dir: Zielverzeichnis für PDF-Ausgabe
+
+    Returns:
+        tuple[bool, str]: (Erfolg, Fehlermeldung oder Info-Text)
+
+    Raises:
+        FileNotFoundError: Wenn XML- oder XSL-Datei nicht existiert
+    """
+```
+
+### Pfadbehandlung
+- Immer `pathlib.Path`-Objekte verwenden, keine Strings
+- `expanduser()` und `expandvars()` für Benutzer-/Umgebungspfade verwenden
+- Projektrelative Pfade werden als relativ gespeichert, zur Laufzeit gegen `project_dir` aufgelöst
+
 ## Architektur

 ### Konfigurationssystem (src/conf.py)
@@ -96,6 +217,24 @@ Beim Erstellen neuer Dialoge:
 - Die UI-Datei wird automatisch als `.py`-Datei von einer VS Code Extension generiert
 - Die generierte UI-Klasse in der Implementierungsdatei importieren und verwenden

+**UI-Import-Pattern:**
+```python
+from PySide6.QtWidgets import QDialog
+from ui.JavaVmConfigDialog_ui import Ui_JavaVmConfigDialog
+
+class JavaVmConfigDialog(QDialog):
+    def __init__(self, parent=None):
+        super().__init__(parent)
+        self.ui = Ui_JavaVmConfigDialog()
+        self.ui.setupUi(self)
+        # Signale NACH setupUi() verbinden
+        self.ui.browseButton.clicked.connect(self._browse_file)
+```
+
+- UI-Klassen NIEMALS direkt erben, nur als `self.ui` Member
+- Alle Widgets über `self.ui.widgetName` zugreifen
+- Signal-Verbindungen immer NACH `setupUi()` aufrufen
+
 ### Hauptfenster (src/ui/MainWindow.py)

 Zentrale Schaltstelle der Anwendung mit mehreren wichtigen Verantwortlichkeiten:
@@ -117,6 +256,13 @@ Zentrale Schaltstelle der Anwendung mit mehreren wichtigen Verantwortlichkeiten:
   - `XmlHashCalculatorThread`: Hintergrund-blake2b-Hash-Berechnung für XML-Dateien
   - `DatabaseTestThread` (in PostgreSqlConfigDialog): Asynchrones Testen von Datenbankverbindungen

+### XSL-Abhängigkeitsgraph (src/ui/XslDependencyDialog.py)
+
+Interaktiver Dialog zur Visualisierung von `<xsl:import/>`- und `<xsl:include/>`-Abhängigkeiten zwischen XSL-Dateien:
+- Sidebar mit Suchfilter zur Navigation
+- Abhängigkeitsgraph-Darstellung via vis.js
+- Parsing der XSL-Dateien mit lxml
+
 ### Hash-Berechnungssystem

 Die Anwendung verwendet blake2b-Hashing zur Verfolgung von XML-Dateiänderungen:
@@ -132,15 +278,40 @@ Die Anwendung verwendet blake2b-Hashing zur Verfolgung von XML-Dateiänderungen:
 Die Anwendung unterstützt mehrere Qt-Themes:
 - Theme-Auswahlmenü wird dynamisch aus `QStyleFactory.keys()` befüllt
 - Theme-Präferenz wird in `AppSettings.theme` gespeichert
- Dark-Theme-Unterstützung via `qdarktheme` Paket (aktuell in main.py auskommentiert)

 ### Datenbankintegration

 PostgreSQL-Integration mit Polars und ConnectorX:
 - Konfiguration wird im `PostgreSqlDb`-Modell mit SSL-Modus-Unterstützung gespeichert
- SQL-Abfragen werden via `_execute_sql_query()` im MainWindow ausgeführt
+- SQL-Abfragen werden asynchron via `DatabaseQueryThread` im `DatabaseMixin` ausgeführt
 - Ergebnisse werden in Polars DataFrames geladen

+### Thread-basierte Operationen
+
+```python
+from PySide6.QtCore import QThread, Signal
+
+class HashCalculatorThread(QThread):
+    progress = Signal(int)
+    finished = Signal(dict)
+
+    def __init__(self, files: list[Path]):
+        super().__init__()
+        self.files = files
+
+    def run(self):
+        for i, file_path in enumerate(self.files):
+            hash_value = calculate_hash(file_path)
+            self.progress.emit(i + 1)
+        self.finished.emit(results)
+
+# Verwendung
+thread = HashCalculatorThread(xml_files)
+thread.progress.connect(self._on_progress)
+thread.finished.connect(self._on_finished)
+thread.start()  # NICHT run() direkt aufrufen!
+```
+
 ## Wichtige Konventionen

 ### Deutsche Sprache
@@ -150,11 +321,6 @@ Die Codebasis verwendet Deutsch für:
 - Variablennamen wo kontextuell passend
 - Log-Meldungen

-### Pfadbehandlung
- Immer `pathlib.Path`-Objekte verwenden, keine Strings
- `expanduser()` und `expandvars()` für Benutzer-/Umgebungspfade verwenden
- Projektrelative Pfade werden als relativ gespeichert, zur Laufzeit gegen `project_dir` aufgelöst
-
 ### ID-basierte Lookups
 Konfigurationsentitäten (Tools, Datenbanken) werden in Projekten über ID referenziert. Die Hilfsmethoden des `Project`-Modells (`getXsl()`, `getJavaVm()`, etc.) verwenden, um IDs in Anzeigewerte aufzulösen.