Traduzione Avahi e PackageKit
Milo Casagrande
milo at ubuntu.com
Sat Dec 12 21:24:38 UTC 2009
Il 12 dicembre 2009 20.08, Guido Grazioli <guido.grazioli at gmail.com> ha scritto:
>
> Non confondere Unicode con UTF-8, sono uno l'implementazione
> dell'altro.
Non mi sono confuso: il carattere « è un carattere definito
nell'Unicode, che UTF-8 è in grado di rappresentare. La parte che
definisce quell'insieme di caratteri in Unicode è (più o meno) la
stessa che definisce i caratteri dell'ISO-8859-1 (ovviamente con
codice diverso), quindi sì, c'è anche lì.
> D'altra parte non tutti i caratteri ascii sono stampabili, e inoltre posix
> NON è limitato all'ascii per regex, la limitazione è solo per i motori
> PCRE (Perl Compatible Reg Ex)
> http://www.regular-expressions.info/refflavors.html
Ero convinto che in Java l'implementazione del costrutto "Punct" per
le RE fosse solo ASCII...
> Anzi i motori POSIX hanno le collation nel supporto unicode,
> per cui [:alpha:] cattura à per a, e comunque hai [[=a=]] che
> cattura entrambe.
Giusto, [: :] indica una classe di caratteri e ci sono pure le
collation, me ne ero dimenticato!
Credo comunque che con Python non funzioni, ma non ho provato. Se non
ricordo male non supporta(va?) le collation...
--
Milo Casagrande <milo at ubuntu.com>
More information about the trans-it
mailing list