This commit is contained in:
Jürgen Mummert
2025-12-25 14:41:20 +01:00
parent 9831c0c72d
commit e3c29d70e9
+16 -14
View File
@@ -11,21 +11,26 @@ class PdfIndexService
public function handlePdfLinks(array $pdfLinks): void
{
error_log('PDF Service aufgerufen');
error_log('PDF Links Count: ' . count($pdfLinks));
error_log('PDF Links: ' . json_encode($pdfLinks, JSON_UNESCAPED_SLASHES));
foreach ($pdfLinks as $url) {
try {
error_log('bearbeite PDF: ' . $url);
$normalizedUrl = $this->normalizePdfUrl($url);
error_log('umgewandelte URL: ' . var_export($normalizedUrl, true));
if ($normalizedUrl === null) {
error_log('→ PDF übersprungen (URL nicht normalisierbar)');
error_log('→ übersprungen: normalizePdfUrl() == null');
continue;
}
error_log('umgewandelte URL: ' . $normalizedUrl);
$absolutePath = $this->getAbsolutePath($normalizedUrl);
error_log('absoluter Pfad: ' . var_export($absolutePath, true));
if ($absolutePath === null || !is_file($absolutePath)) {
error_log('→ PDF übersprungen (Datei nicht gefunden): ' . $absolutePath);
error_log('→ übersprungen: Datei nicht gefunden');
continue;
}
@@ -33,7 +38,7 @@ class PdfIndexService
$checksum = md5($normalizedUrl . $mtime);
if ($this->alreadyIndexed($checksum)) {
error_log('→ PDF bereits indexiert (Checksumme vorhanden)');
error_log('→ übersprungen: bereits indexiert');
continue;
}
@@ -42,19 +47,16 @@ class PdfIndexService
$text = $this->parsePdf($absolutePath);
if ($text === '') {
error_log('→ PDF übersprungen (kein Text extrahiert)');
error_log('→ übersprungen: parsePdf() leer');
continue;
}
$this->insertPdf(
$normalizedUrl,
$title,
$text,
$checksum,
$mtime
);
$this->insertPdf($normalizedUrl, $title, $text, $checksum, $mtime);
error_log('geschrieben in tl_search_pdf');
} catch (\Throwable $e) {
error_log('PDF Service FEHLER (pro PDF): ' . $e->getMessage());
error_log($e->getTraceAsString());
}
}
}