martedì 26 ottobre 2010

Confrontare le differenze fra due documenti PDF

Nota: qui suggerisco il programma a interfaccia grafica DiffPDF che permette di effettuare un confronto più efficace fra due documenti PDF.

Un semplice metodo per confrontare due documenti in formato PDF è sfruttare l'accoppiata pdftotext (per convertire i PDF in testo puro) + diff (per controllare le differenze). Mi ero stancato di eseguire tutti i soliti comandi allora ho scritto questo script fresco fresco:
#!/bin/bash

function converti() {
    txt=$(eval "expr \$"$1" ")
    pdf=$(eval "expr \$"$2" ")
    scelta=""
    while [ -f "$txt" ]; do
        read -p "Il file $txt esiste già, sovrascriverlo? [s/n]: " scelta
        case "$scelta" in
            s|S|y|Y)
                break 2
                ;;
            n|N)
                read -p "Specifica un file di output differente: " txt
                ;;
        esac
    done
    if ! pdftotext "$pdf" "$txt"; then
        exit 1
    fi
    eval "$1=$txt"
}

if [ $# -ne 2 ]; then
    echo "Uso: $0 PDF1 PDF2"
    exit 1
fi
pdf1=$1
pdf2=$2
txt1=$(dirname "$pdf1")/$(basename "$pdf1" .pdf).txt
txt2=$(dirname "$pdf1")/$(basename "$pdf2" .pdf).txt
converti txt1 pdf1 && converti txt2 pdf2
if [ $? -eq 0 ]; then
    diff -u "$txt1" "$txt2" | less
fi
rm -f "$txt1" "$txt2"
exit 0
Per utilizzarlo basta copiare lo script in un file con un editor di testo a piacere, salvare il file chiamandolo, per esempio, pdf-diff, renderlo eseguibile e posizionarlo nella cartella ~/bin (ricordo che la tilde ~ è un'abbreviazione della cartella home dell'utente corrente), creandola se eventualmente non esiste. Date nel terminale il comando
. ~/.profile
(per i curiosi serve a caricare il file ~/.profile che aggiunge la cartella $HOME/bin alla variabile d'ambiente $PATH), dopo di ciò dovrebbe essere sufficiente dare nel terminale il comando
pdf-diff /percorso/del/primo/file /percorso/del/secondo/file
(o il nome che avete dato allo script).

Non sarà perfetto, ha tutti i limiti che si riscontrano nel passaggio da un PDF a un file di testo puro (per esempio se cambia un'immagine non se ne accorge e la buona riuscita del confronto dipende da quanto bene pdftotext riesce a leggere i documenti) ma è abbastanza veloce e ho trovato questo sistema spesso molto utile.

Ho scritto anche il corrispondente script Nautilus (utilizza zenity):
#!/bin/bash

titolo="Confronto PDF"

function converti() {
    txt=$(eval "expr \$"$1" ")
    pdf=$(eval "expr \$"$2" ")
    while [ -f "$txt" ]; do
        if ! zenity --question --title="$titolo" --text="Il file $txt esiste già, sovrascriverlo?"; then
            txt=$(zenity --entry  --title="$titolo" --text="Specifica un file di output differente: ")
        else
            break 2
        fi
    done
    pdftotext "$pdf" "$txt"
    case $? in
        0)
            ;;
        1)
            zenity --error  --title="$titolo" --text="Si è verificato un errore nell'apertura di $pdf."
            exit 1
            ;;
        2)
            zenity --error  --title="$titolo" --text="Si è verificato un errore nell'apertura di $txt."
            exit 1
            ;;
        3)
            zenity --error  --title="$titolo" --text="Si è verificato un errore collegato ai permessi di $pdf."
            exit 1
            ;;
        *)
            zenity --error  --title="$titolo" --text="Si è verificato un errore!"
            exit 1
    esac
    eval "$1=$txt"
}

if [ $# -ne 2 ]; then
    zenity --error --title="$titolo" --text="Devi selezionare due file alla volta"
    exit 1
fi
pdf1=$1
pdf2=$2
txt1=$(dirname "$pdf1")/$(basename "$pdf1" .pdf).txt
txt2=$(dirname "$pdf1")/$(basename "$pdf2" .pdf).txt
converti txt1 pdf1 && converti txt2 pdf2
if [ $? -eq 0 ]; then
    diff -u "$txt1" "$txt2" | zenity --text-info  --title="$titolo" --filename=/dev/stdin
    rm -f "$txt1" "$txt2"
else # non dovrebbe arrivare mai qui, metto per sicurezza
    zenity --error  --title="$titolo" --text="Si è verificato un errore!"
    exit 1
fi
exit 0
Per utilizzare questo secondo script aprite un file vuoto con un editor di testo, copiate lo script nell'editor e salvatelo nella cartella ~/.gnome2/nautilus-scripts chiamandolo, per esempio, "Confronta PDF". Rendete quindi eseguibile lo script. Così potrete selezionare due file PDF da confrontare e, facendo clic con il tasto destro, scegliete ScriptConfronta PDF (o il nome che avete dato allo script).

Dal punto di vista tecnico, gli script presentano un aspetto un po' particolare: la funzione converti (che serve per convertire il pdf in testo ed eseguire i controlli del caso) presenta una sorta di passaggio di variabile per riferimento e non per valore. Il "trucco" sta nel passare alla funzione non il valore della variabile ma il suo nome (chi ha familiarità con altri linguaggi di programmazione potrebbe trovare ciò naturale). I dettagli possono essere visti qui: http://www.pluto.it/files/ildp/guide/abs/functions.html#DEREFERENCECL.

sabato 23 ottobre 2010

Importare in Gmail la posta inviata di un altro account

Questa volta parlerò di un problema non legato al sistema operativo GNU/Linux, però è un problema che mi ha tenuto impegnato per un po' e voglio spiegare il barbatrucco con cui l'ho risolto: importare in Gmail la posta inviata di un altro account.

In Gmail è possibile importare le email ricevute da un qualsiasi altro account di posta elettronico nel proprio account su Gmail. Se si vuole è possibile anche continuare a scaricare automaticamente la posta da altri account (al massimo 5) con la funzione chiamata Mail Fetcher. Purtroppo né l'importazione manuale della posta né Mail Fetcher importano anche le email inviate dagli altri account, come spiegato nella sezione di Risoluzione dei problemi della guida. È vero che non è possibile farlo automaticamente, ma con qualche giro sono riuscito nel mio intento. Per fare ciò ho dovuto dare un'occhiata all'organizzazione della posta su Gmail. Il barbatrucco funziona pienamente se l'account da cui si vogliono importare le email verrà aggiunto ai mittenti personalizzati.

Le mail (che normalmente sono raccolte per conversazioni, se non vi piace questa visualizzazione potete disattivarla da Impostazioni e nella scheda Generali selezionate Visualizzazione per conversazione disattivata) non sono suddivise in cartelle ma hanno delle "etichette" che vengono loro attribuite. L'uso è praticamente lo stesso, la differenza è che a una mail possono essere attribuite più etichette, è come se si trovasse in più cartelle contemporaneamente. Tutte le mail si trovano nello spazio chiamato Tutti i messaggi (il collegamento sta nella barra sulla sinistra, se non la vede premete Altre), non vengono però visualizzate le email eliminate (le quali hanno l'etichetta Cestino) e quelle segnate come spam (che hanno l'etichetta Spam). (quasi) Tutti i "gruppi" che vediamo sulla sinistra non fanno altro che raccogliere le email secondo le etichette che le sono state attribuite. Così, le email posizionate in Posta in arrivo sono semplicemente delle mail che hanno l'etichetta Posta in arrivo (per quanto possa sembrare strano, una email inviata può trovarsi in Posta in arrivo: basta che abbia la corrispondente etichetta), le eventuali email presenti in Personale, Lavoro, ecc. hanno le rispettive etichette e, come detto, una mail può anche avere più etichette contemporaneamente (e quindi comparirà in tutti i rispettivi "gruppi"). Invece le mail presenti in Posta inviata hanno come caratteristica di avere come mittente l'account in uso o uno dei mittenti personalizzati.

Vi starete chiedendo: cosa c'entra tutto questo discorso con l'importazione delle email inviate? Calma, arriviamo subito alla soluzione del problema facendo un breve riepilogo di quello che abbiamo appreso. Sappiamo che Gmail può importare dagli altri account la posta arrivata, ma non quella inviata, allora potremmo pensare di spostare nel precedente account le email inviate nella cartella di Posta in arrivo (in genere questa è una operazione possibile, naturalmente non posso spiegare i dettagli perché variano da provider a provider), ma questa operazione crea l'inconveniente che importando la posta nell'account Gmail le email inviate avranno l'etichetta Posta in arrivo e quindi si troveranno in quel gruppo (a meno che nella fase di importazione non si sia selezionata l'opzione Archivia messaggi in arrivo (Ignora Posta in arrivo)). Sappiamo però anche che per togliere una mail dalla Posta in arrivo basta rimuovere la corrispondente etichetta, niente di più semplice! Ho già specificato che il barbatrucco funziona se l'indirizzo da cui stiamo importando la posta è uno dei mittenti personalizzati, quindi le email si troveranno già automaticamente in Posta inviata, altrimenti non compariranno in questa "cartella" ma solo in Tutti i messaggi (e se questa eventualità non è un problema allora non diventa neanche necessario che l'account da cui si importa sia fra i mittenti personalizzati).

Per non dover rimuovere manualmente le etichette a ciascun messaggio inviato consiglio di suddividere l'operazione di importazione in due punti:
1) importare normalmente nell'account Gmail tutta la posta arrivata al precedente account;
2) dopo aver concluso questa operazione, spostare (nel vecchio account) le email inviate nella cartella ed eseguire nuovamente lo scaricamento in Gmail (tranquilli, le email già importate non saranno scaricate nuovamente) selezionando l'opzione Archivia messaggi in arrivo (Ignora Posta in arrivo). In questo modo, come spiegato già abbastanza bene dal nome dell'opzione, le nuove email che saranno scaricate (nella speranza che ci siano solo le email inviate e non compaia qualche nuova mail :-D ) verranno archiviate, cioè non sarà aggiunta l'etichetta Posta in arrivo.

Nel vecchio account da cui avete importato le email potete ora fare quello che vi pare: riportare le email inviate nella cartella di posta inviata, cancellarle, ecc. Ovviamente è possibile selezionare l'opzione Archivia messaggi in arrivo (Ignora Posta in arrivo) già nell'importazione di tutte le mail ricevute, in questo caso non si rende neanche necessaria una doppia importazione, si possono importare tutte insieme email ricevute e inviate (naturalmente dopo aver spostato queste ultime nella cartella di posta ricevuta). Se si utilizza Mail Fetcher, dopo aver effettuato l'importazione dei messaggi inviati potreste voler togliere l'opzione Archivia messaggi in arrivo: ricordatevi di farlo, altrimenti le nuove mail ricevute sul vecchio account non passeranno da Posta in arrivo!

Questo è il barbatrucco che ho escogitato io, non escludo che esista qualche metodo più semplice, in questo caso sarei felice di conoscerlo! :-)

venerdì 22 ottobre 2010

Opzioni utili per comporre documenti LaTeX in GNU Emacs + AUCTeX

GNU Emacs, come ho già avuto modo di dire, è un potente editor di testo che permette di fare di tutto e di più. Esistono numerose funzioni che permettono di facilitare la scrittura di codici in numerosi linguaggi di programmazioni, compreso, ovviamente LaTeX (anche se in questo caso il nome "linguaggio di programmazione" non è del tutto adeguato). Uno dei tanti motivi per cui Emacs è molto apprezzato è la sua possibilità di personalizzazione ed espansione: esistono centinaia di estensioni che aumentano notevolmente le potenzialità di questo editor di testo oltre le funzioni fornite nativamente. Esiste (ovviamente) una estensione anche per LaTeX: AUCTeX (ma è utile anche per ConTeXt, docTeX, Texinfo e TeX puro: molte delle impostazioni che vedremo varranno per tutti questi linguaggi, anche se mi riferirò generalmente solo a LaTeX).

Non è mia intenzione spiegare qui come si installa Emacs né tanto meno AUCTeX (anche perché questi pacchetti sono forniti dalla maggior parte delle distribuzioni GNU/Linux, l'installazione è quindi molto semplice se si conosce il funzionamento del proprio gestore pacchetti), ma piuttosto illustrare quali sono le opzioni di AUCTeX (e qualcuna propria di Emacs) che ho trovato personalmente utili. Darò per scontato che si abbia un minimo di familiarità con Emacs, con la notazione delle scorciatoie e dei comandi e anche con AUCTeX (qualche volta però ricorderò come eseguire alcune operazioni). Prima di iniziare ricordo che si può consultare il manuale (in inglese) di AUCTeX all'indirizzo http://www.gnu.org/software/auctex/manual/auctex.html oppure direttamente dentro Emacs con C-h i d m AUCTeX RET. Per la modifica di buona parte delle opzioni seguenti AUCTeX dovrà essere già caricato. Non sono un grande esperto di Emacs, potrei dire a volte delle sciocchezze, spero che mi perdoniate e sono graditi consigli (a ogni modo vi posso assicurare che seguendo questa guida non vi scoppierà il pc :-D).

In AUCTeX è possibile eseguire varie operazioni come compilazione, esecuzione di bibtex, esecuzione di makeindex, cancellazione dei file temporanei, ecc... usando C-c C-c (seguito dal comando che si desidera usare). La cancellazione dei file temporanei viene eseguita usando l'elenco delle estensioni dei file salvato nella variabile LaTeX-clean-intermediate-suffixes. Per modificare questa variabile (come tutte le variabili di Emacs, naturalmente sostituendo il nome dove opportuno) si può usare il comando (ricordo che i comandi possono essere inseriti con M-x, dove M è il cosiddetto tasto Meta e può essere ottenuto con l'ALT, oppure, se non è presente tale tasto, con ESC (rilasciare ESC dopo averlo premuto)):
customize-variable RET LaTeX-clean-intermediate-suffixes RET
Per aggiungere nuove estensioni selezionare INS e inserire di fianco a Regexp: l'espressione regolare (per maggiori informazioni sulle espressioni regolari in Emacs si può consultare il manuale di Elisp in Emacs oppure vedere qui) corrispondente all'estensione che si vuole aggiungere. Per esempio io ho aggiunto le estensioni .tex~ (i file di backup creati da Emacs) e .run.xml (file usati per creare la bibliografia con il pacchetto biblatex) con le seguenti espressioni regolari:
\.tex~
\.run\.xml
Per rendere definitiva la modifica selezionare Save for future sessions (bisognerà fare lo stesso ogni volta che si usa customize-variable).

Emacs si preoccupa anche di indentare correttamente il codice, compresi i vari ambienti. Si può in particolare impostare l'editor in modo che quando viene premuto il tasto di Invio (o, nella notazione di Emacs, RET) il cursore si porti, nel rigo successivo, nella giusta posizione richiesta da una corretta indentazione. Per fare ciò bisogna modificare la variabile TeX-newline-function con il comando:
customize-variable RET TeX-newline-function RET
Selezionare Value Menu e scegliere newline-and-indent. È possibile anche modificare il comportamento di Emacs nell'indentazione all'interno di determinati ambienti modificando la variabile LaTeX-indent-environment-list, sempre con il comando:
customize-variable RET LaTeX-indent-environment-list RET
Io, per esempio, ho aggiunto l'ambiente lstlisting per fare in modo che Emacs non aggiungesse automaticamente il rientro per il testo inserito in questo ambiente. Per fare ciò ho selezionato INS, scritto lstlisting di fianco a Environment: e dopo aver messo la spunta a Function: ho scritto nel relativo spazio current-indentation (proprio come risulta di default per l'ambiente verbatim).

Emacs permette anche l'evidenziazione della sintassi di LaTeX, ma in alcuni (rari) casi può andare in difficoltà. Per esempio ho avuto problemi con il già citato ambiente lstlisting in quanto AUCTeX 11.86 non conosce bene il suo funzionamento (per esempio l'inserimento del simbolo del dollaro $ rovina tutta l'evidenziazione del documento). Per fortuna è possibile spiegargli che lo deve trattare allo stesso modo dell'ambiente verbatim (in pratica tutto ciò che si trova all'interno di questo ambiente non viene interpretato da Emacs per quanto riguarda l'evidenziazione della sintassi) modificando la variabile LaTeX-verbatim-environments:
customize-variable RET LaTeX-verbatim-environments RET
aggiungete lstlisting (penso che ormai avrete capito come funziona questo tipo di interfaccia di modifica delle variabili) e il gioco è fatto.

In maniera predefinita Emacs compila i documenti in formato DVI. Se invece si vuole impostare in maniera predefinita il formato PDF bisogna modificare il valore della variabile TeX-PDF-mode:
customize-variable RET TeX-PDF-mode RET
Selezionare Toggle fino ad arrivare a on (non-nil).

Se si è installata una distribuzione di LaTeX in un percorso non riconosciuto immediatamente da Emacs e AUCTeX bisognerà modificare alcune variabili. Per esempio, io ho installato TeX Live 2010 seguendo questa guida di Enrico Gregorio e tutti i file di LaTeX si trovano in sottocartelle di /usr/local/texlive/2010/ (in cui Emacs e AUCTeX normalmente non cercano). Fra le variabili che potrebbero dover essere cambiate ci sono TeX-macro-global (contiene, ricorsivamente, le cartelle in cui AUCTeX cercherà i file di stile) e exec-path (contiene i percorsi in cui Emacs cerca i programmi da eseguire). La modifica di queste variabili è simile a quanto visto finora. Per la prima variabile ho aggiunto il percorso /usr/local/texlive/2010/texmf-dist/tex/, mentre per exec-path ho aggiunto /usr/local/texlive/2010/bin/i386-linux/ (su architetture diverse dal 32 bit questo percorso sarà sicuramente diverso. Controllate per bene la posizione in cui avete installato la distribuzione).

Per modificare il programma con cui viene aperto il documento di output (sia esso in formato DVI, PDF, HTML, ecc) tramite C-c C-c View RET bisogna modificare la variabile TeX-view-program-selection. Come al solito per personalizzare la variabile si può usare
customize-variable RET TeX-view-program-selection RET
Le impostazioni viste finora vengono salvate automaticamente da Emacs nel file di inizializzazione ~/.emacs (ricordo che la tilde ~ è un'abbreviazione del percorso della propria cartella home, mentre i file che hanno il nome che inizia con un punto sono nascosti). Tutte queste impostazioni possono essere anche memorizzate modificando manualmente il file .emacs (per poter fare ciò autonomamente bisogna però conoscere il linguaggio Emacs Lisp). Vediamo ora qualche altra utile opzione che imposteremo modificando direttamente il file .emacs (queste comunque possono sempre essere impostate anche utilizzando l'interfaccia di customize-variable).

Il manuale di AUCTeX suggerisce di aggiungere a .emacs le seguenti linee:
(setq TeX-auto-save t)
(setq TeX-parse-self t)
in modo che ottenere supporto per i pacchetti LaTeX che vengono usati nei propri documenti (l'opzione TeX-parse-self fa effettuare a Emacs il parsing del documento e le informazioni verranno raccolte in una sottocartella della directory del documento modificato chiamata auto/. Se non si desidera affollamento nelle proprie cartelle si potrebbe non voler attivare queste due opzioni).

Se si usa frequentemente suddividere i propri documenti LaTeX in più parti da includere nel file principale con i comandi \input o \include può essere utile aggiungere al file .emacs l'opzione
(setq-default TeX-master nil)
In questo modo, all'apertura dei documenti LaTeX Emacs chiederà qual è il file principale associato (su cui dovrà, per esempio, eseguire i comandi di compilazione).

Si può far in modo che all'apertura di un documento LaTeX Emacs esegua il controllo ortografico al volo aggiungendo a .emacs l'opzione
(add-hook 'TeX-mode-hook 'flyspell-mode)
Inoltre, se si usa spesso LaTeX per comporre documenti matematici potrebbe essere utile aggiungere l'opzione
(add-hook 'TeX-mode-hook 'LaTeX-math-mode)
che permette il rapido inserimento di numerosi simboli matematici (vedi manuale). Infine, per fare in modo che il cursore vada a capo dopo l'inserimento di un numero prefissato di caratteri per rigo (ovviamene Emacs è intelligente, non spezza una parola in due, va a capo in modo che il rigo risulti lungo al massimo il numero prefissato di caratteri) si può aggiungere l'opzione
(add-hook 'TeX-mode-hook 'turn-on-auto-fill)
Il numero di caratteri per rigo dopo il quale Emacs dovrà andare a capo è salvato nella variabile fill-column. Lascio per esercizio scoprire come si modifica tale variabile (ok, lascio un indizio: si può usare sempre il solito comando :-D).

Per effettuare un controllo della sintassi al volo si può inserire questo codice nel file di inizializzazione:
(require 'flymake)
(defun flymake-get-tex-args (file-name)
  (list "chktex" (list "-q" "-v0" file-name)))
(add-hook 'LaTeX-mode-hook 'flymake-mode) 
I dettagli di questa istruzioni e sue alternative sono illustrati nel post Emacs: effettuare il controllo della sintassi di documenti LaTeX.

sabato 9 ottobre 2010

Ipe: An error occurred during the Pdflatex run. There was an error reading the Pdflatex output [Risolto]

Se avete installato la distribuzione TeX Live 2010 e usate il programma di grafica Ipe per creare disegni, andando a compilare un'immagine potreste ricevere la seguente finestra di errore:
An error occurred during the Pdflatex run

There was an error reading the Pdflatex output



La soluzione a questo problema si trova(va) qui: http://http.typke.com/cgi-bin/bugzilla3/show_bug.cgi?id=350 e consiste nell'aggiungere al preambolo dell'immagine il comando \pdfobjcompresslevel0. Ricordo che il preambolo di un'immagine Ipe può essere modificato da EditDocument properties (oppure con la scorciatoia da tastiera CTRL + Shift + P), scrivendo nel campo Latex preamble.

Git4LaTeX: una guida introduttiva a Git per progetti LaTeX


Nota: la guida è stata aggiornata dopo la prima pubblicazione.

Chi scrive documenti con LaTeX potrebbe a un certo punto avere il bisogno di controllare lo sviluppo dei vari documenti, in modo da controllare i cambiamenti effettuati tra un salvataggio e l'altro per poter, eventualmente, anche individuare quando sono stati introdotti degli errori e poter in pochi passi ripristinare una versione precedente. In vostro soccorso arriva allora Git, programma di controllo versione. L'uso tipico di Git è quello di tenere traccia dello sviluppo di un software, ma svolge ugualmente bene il suo lavoro con i documenti LaTeX.

Proprio per spiegare come utilizzare insieme Git e LaTeX, il GuIt (Gruppo utenti Italiani di TeX) ha pubblicato una guida tematica, con licenza CC-BY-NC-SA 2.5 Italy, sull'uso di Git per gestire lo sviluppo di un documento scritto in LaTeX. La guida non si prefigge grandi scopi, non diventerete degli esperti di Git leggendola, ma è sicuramente d'aiuto per riuscire a usare insieme questi due utili strumenti.

Trovate il codice sorgente della guida su GitHub all'indirizzo https://github.com/GuITeX/guidagit e potete scaricare il documento PDF all'indirizzo http://www.guitex.org/home/images/doc/GuideGuIT/guidagit.pdf. Se avete Git sul vostro sistema potete potete clonare il repository con il comando
git clone https://github.com/GuITeX/guidagit.git
Infine il codice sorgente può essere scaricato anche in un archivio compresso all'indirizzo https://github.com/GuITeX/guidagit/archive/master.tar.gz.

Qualsiasi critica (costruttiva), segnalazione di imprecisione o richiesta di chiarimento è ben gradita!

Happy TeXing :-)