Pobranie liczby słów dokumentu pdf w Evince

19

Czy jest jakikolwiek sposób, aby uzyskać liczbę słów dokumentu PDF, który przeglądam w Evince, domyślnej przeglądarce plików pdf Ubuntu? Jestem w stanie konwertować dokumenty do plików tekstowych i uzyskać liczbę słów z terminala, ale chciałbym móc szybko uzyskać do nich dostęp bez konieczności korzystania z terminala. Czy jest jakaś wtyczka, która może to zrobić, czy jest już wbudowana i po prostu jej brakuje?

P.S. Wolałbym nie zmieniać mojej przeglądarki, ponieważ Evince jest domyślną przeglądarką plików PDF w Ubuntu i chciałbym zrobić jak najwięcej przy użyciu domyślnych aplikacji, ponieważ wiele z nich, w tym Evince, jest naprawdę miłych.

    
zadawane Chris Wilson 08.11.2010, 20:11
źródło

4 odpowiedzi

10

Odpowiedź od Olafa Leidingera na liście dyskusyjnej Evince:

Myślę, że taka funkcja lepiej pasuje do edytorów dokumentów, tak jak oni więcej informacji na temat dokumentu jako zwykłej przeglądarki i liczenie słów trywialny. Weź jako przykład plik PDF. To, co widzisz jako tekst, może być w pewnym sensie kształtu grafiki wektorowej. Nawet jeśli tekst jest zawarty w pliku PDF, te słowa, które widzisz, mogą składać się z wielu "narysowanych tekstów na miejscu (y, x) "- polecenia - np. w przypadku umlautów lub końca linii. Tak więc jedno słowo może być liczony jako wiele słów. Dlatego myślę, że może to być trudne do wdrożenia taka cecha niezawodnie. Przyjrzyj się pdftotext, aby zobaczyć, co mam na myśli.
    
odpowiedział Chris Wilson 10.11.2010, 12:22
źródło
26

Możesz to zrobić za pomocą linii poleceń:

pdftotext filename.pdf - | tr -d '.' | wc -w
    
odpowiedział Sid 08.11.2010, 20:22
źródło
9

Co powiesz na skrypt szybkiego basha, który wymaga zenity i ujawnia. Wywołanie bez argumentu spowoduje wyświetlenie okna dialogowego, w którym można wybrać plik. Po wywołaniu z argumentem (lub po wspomnianym oknie dialogowym) otworzy plik i wyświetli okno dialogowe z liczbą słów.

Innymi słowy, skopiuj poniższy tekst do pliku tekstowego, o nazwie evince-word-count.sh lub coś podobnego, zapisz go gdzieś w swojej ścieżce (np. ~/bin/ ), spraw, aby był wykonywany (przez kliknięcie prawym przyciskiem myszy i właściwości lub z chmod +x ~/bin/evince-word-count.sh ),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename=""
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

Teraz kliknij prawym przyciskiem myszy na plik PDF w Nautilusie, wybierz "Otwórz za pomocą ...", a następnie otwórz go za pomocą evince-word-count.sh. Teraz, gdy otworzysz plik PDF, otworzy się on w jawny sposób i da ci liczbę słów.

    
odpowiedział frabjous 08.11.2010, 23:14
źródło
4

Nie sądzę, że jest to możliwe (jest to technicznie możliwe, ale nie zostało zaimplementowane).

Musisz pamiętać, że Evince jest dokumentem przeglądarka , a liczba słów jest funkcją, która jest zwykle wymagana w edytorze (tak, wiem, że nie zawsze tak jest ).

Może chcesz skontaktować się z programistami Evince i zapytać, czy mieliby jakiekolwiek zainteresowanie wdrożeniem tej funkcji.

    
odpowiedział 8128 08.11.2010, 20:16
źródło

Przeczytaj inne pytania na temat tagów