Posėdžių temos
Posted by Žygimantas Medelis
Dažniausiai pasikartojančios Seime svarstomų klausimų formuluotės turėtų atspindėti pagrindines temas, nagrinėjamas posėdžių metu. Suskaičiavus pasikartojančius žodžius svarstytų klausimų pavadinimų formuluotėse, šios kadensijos Seimo 3 eilinėje ir 2 neeilinėje sesijose gaunamas štai toks rezultatas:
administracinių apsaugos asamblėjoje ataskaitos atkūrimo audito banko baudžiamojo biudžeto biudžetų cukraus dalies darbo darbų delegacijos departamento draudimo europos fondo gamybos gyventojų ištirti kalėjimų karių komisijos komitetų kompensacijų kontrolės konvencijos krašto laikinosios lengvatų metų ministerijos ministro mokesčio mokesčių mokslo mokėjimo nacionalinio nafta narių nekilnojamąjį netekusiais netekusiu nuosavybės nustatymo pajamų pareigūnų pareiškimai parlamentinėje patvirtinimo pažeidimų pensijų pernašų piliečių pirmininko posėdžio prie priedo priedėlio pripažinimo programos prokuratūros protokolo radijo ratifikavimo reikalų rezoliucijos rinkimų rodiklių rudens saugumo savaitės savivaldos savivaldybių socialinio specialiųjų straipsniu sudarymo sudėties susitarimo sutarties sveikatos tabako tarnybomis tarnybos tarpvalstybinių tarybos teisių teisės televizijos transporto turto turtą tvarkos tyrimo tyrimų užsienio valanda valstybinio valstybinių valstybinės veiklos vidaus vietos vyriausybės įgyvendinimo įmonių įstaigų Žemės
Iškarto matyti jog komisijos buvo kur kas svarsbesnė (ar bent jau dažniau svarstyta) tema nei mokslas. Tai taip pat sutampa su to meto situacija, kai buvo kuriamos komisijos nagrinėti tam tikrų politikų veiksmams. Europa irgi lyg ir nestebina.
Idomesnis šių doumenų panaudojimas būtų galimas lyginant įvairių Seimo kadencijų rezultatus, ypač jei jų metu daugumą sudarė skirtingų politinių ideologijų partijos. Šios kadensijos Seimo dauguma yra kairioji, todėl įstatimų projektuose dažnai matomi žodžiai: draudimo, pensijų, socialino. Jei tokia analizė ištikrųjų veikia, tai dešiniosios daugumos Seime turėtų vyrauti kitokios formuluotės.
Tai tik pirmas pabandymas, tikrinant ar šita idėja veikia. Tam kad tai taptu naudingesnių įrankiu reikia išspresti nemažai problemų. Žodžiai socialinis, socialinio yra tie patys ir juos reiktų skaičiuoti kartu, tačiau tam reikia padaryti sistemą kuri sugeba analizuoti žodžių galūnes. Taip pat neretai yra naudojamos žodžių grupės o ne atskiri žodžiai, kaip Mažeikių nafta atveju reiktų tai interpretuoti ne kaip du atskirus žodžius o kaip vieną formuluotę. Įvairųs procedūriniai žodžiai kaip projektas, straipsniais, tvirtinimas yra labai dažnai vartojami ir juos tenka pašalinti tačiau taip atsiranda šioks toks subjektyvus elementas, sprendžiant kurie žodžiai turi būti išmesti. Taigi tam kad tokią analizę įdėti į Seimo statistikos projektą dar reikia nemažai padirbėti. Be to tai būtu tik viena, platesnės įstatimų analizės ir paieškos sistemos, apie kurią kažkada esu užsiminęs ir kurią vis ruošiuosi aprašyti, dalis.
atrodo labai įspūdingai ir įdomiai. bet tikrai, turbūt rezultatai būtų žymiai prasmingesni/tikslesni, jei būtų "sumuojami" žodžiai turintys vieną prasmę (ne tik bendrą šaknį).
bendra šaknis turbūt galėtų būti išskiriama naudojant kokį nors pattern matching, pvz. social* ar pan. ar bandei? ar daug keisti reiktų?
Jei pavyktu sugalvoti gudrų regexp (aš jį tik beveik suprantu) kuris ieškotu žodžių tik pagal šaknis tai keisti nieko nereiktu, nes ir dabar su regexp tekstas skaldomas. Bet čia problema kur tą žvaigždutę padėti. 2, 3, 4 pozicijoj nuo žodžio galo?
O dėl sumavimo pagal panašias prasmes tai nelabai įsivaizduoju kaip būtų galima padaryti.
sumavimas pagal panašias prasmes more involved. pvz., skaičiuoti, kiek yra žodžių ar žodžių junginių, atitinkančių tam tikrą savoką, pvz. socialinę politiką:
socialinis|socialistas|socialistė|pašalpa
tiesa, regexp užrašyti aš nemoku.