Il 12 dicembre 2009 17.34, Guido Grazioli <guido.grazioli(a)gmail.com> ha scritto:
Quello che intendevo io, scendendo nel dettaglio tecnico, è
che la classe posix (e mi sembra anche java, a memoria) delle
regular expression per la punteggiatura
[:punct:] -> [-!"#$%&'()*+,./:;<=>?@\[\\\]_`{|}~]
*NON* contiene i caratteri «» , mentre contiene sia l'apice singolo che
doppio. Se mi confermi che quando $LANG=it_IT oppure $LC_ALL=it
la classe [:punct:] contiene anche «» allora non ci sono problemi.
Nel caso contrario invece, parliamone.
Non possono esserci le caporali: quelli sono caratteri stampabili
ASCII (a 7 bit?), questi («») sono Unicode e le regular-expression
POSIX si basano su ASCII (o su una delle sue forme).
In ogni caso sei limitato: [a-z] non include le lettere accentate.
--
Milo Casagrande <milo(a)ubuntu.com>