Формат појмовника — диверглос ИксМЛ

Часлав Илић caslav.ilic at gmx.net
Sat Apr 12 20:04:57 UTC 2008


>> [: Часлав Илић :]
>> [...] угњеждени бирач, који узима део текста према окружењу у којем се
>> појмовник представља (нпр. да л' на сајту Мозиле, или где већ). У њему,
>> ниске fed, moz, ooo, кључеви су окружења.
>
> [: Goran Rakic :]
> Ово је проблематично и за унос и за обраду, [...]

Друга могућност је била да оставим нормалан ИксМЛ, нпр. уместо:

  ~ooo:остави|fed moz:клипборду~

нешто као:

  <sel><v env="ooo">остави</v><v env="fed moz">клипборду</v></sel>

али то више ни на шта не личи за ручно уређивање.

Руку на срце, ИксМЛ-ом баш и нисам одушевљен као форматом за ручни унос, али
је велика и лако доступна подршка разних алатки (па и за унос ваљда), и
доста људи зна о чему се ради. Тако да нисам хтео да кренем у страну нечег
потпуно специјалног, али за ово угњеждено бирање нисам могао да се
суздржим :)

> [...] питање је шта се дешава када се унесе ново окружење. Као и ти, немам
> боље решење.

Кад се унесе ново окружење, онда би тај који га уноси требало да прође кроз
све појмове (или потражи све из сопственог речника) и додели кључеве
окружења тамо где су применљиви. Па тако, да потражи и све упућиваче на
сваки концепт који обради (што је просто, по јединственом идентификатору).

Даље, сад ми паде на памет, могло би да се успостави и спадање окружења.
Нпр. за Опенофис каже, ако нема изричито додељен израз, узми онај из Гнома
(а за Гном рецимо обрнуто). Што се формата тиче, ово би био само још један
атрибут тамо у дефиницији окружења.

За оно што пропадне кроз оба ова без разрешења (на излазу за одређено
окружење), клијент нека бира како хоће: основни подтекст угњежденог бирача,
тј. онај којем окружење није наведено као најчешћем (нпр.
~датотека|kde:фајл~, гунђ, ако остане), па онда онај са највише окружења, па
онај чије окружење има највише означених израза у појмовнику... Наравно, она
скрипта што је планирам може и да упозори на угњеждене бираче који нити
имају основни подтекст, нити наводе окружење за које се гради излаз.

> Да ли си размишљао о некој WordNet-оликој структури међу концептима? Да ли
> би то имало употребну вредност при формирању појмовника?

Ворднет ми мутно стоји на памети као нека лингвистичка база, и сад пошто сам
мало гуглао, не могу да се изборим са шумом материјала :) Може ли упут на
нешто конкретно? Такође не знам колико си свеобухвано мислио — додатне
ознаке да подрже такво структурирање, угњеждени делови Ворднетовог формата,
или како већ — па мали примерчић не би био лош.
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: application/pgp-signature
Size: 189 bytes
Desc: This is a digitally signed message part.
Url : http://lists.fedoraproject.org/pipermail/trans-sr/attachments/20080412/b5394066/attachment.bin 


More information about the trans-sr mailing list