2022 szeptember elején egy érdekes demo projekt keretében a GeoX Ceglédbercel település címadatbázisát készítette el az alábbi szempontok szerint:

 
koordináta
koordináta pontossága
adatmélység
elérhetőség
BM (KEKKH)
×
ajtó
GeoX (Cím2 adatbázis)
interpolált
egész házszám
KSH
?
ajtó
×
Lechner Tudásközpont (EHA)
telek
ajtó
Magyar Posta
?
ajtó
×
Ügyfél adatbázis
?
ajtó
?

Noha a Magyar Posta és a KSH adatbázisa elég széles spektrumot lefed (lakott és nem lakott címeket egyaránt), nagy hátránya, hogy nem hozzáférhető. Másik hiányosságuk a koordináták pontossága.

támponti postaládák

Támponti postaládák

A KSH sem rendelkezik teljes körű koordinátákkal, mert a külterületek esetében nem fontos számukra az egyedi cím-koordináta.

A BM lakcímnyilvántartása kiváló forrás a lakott címek esetében, de semmilyen koordinátát nem tartalmaz, ellenben minden évben friss adatbázis áll rendelkezésre. Sajnos a nem lakott címekről sem tartalmaz információt.

Ügyfél adatbázisok közül az áramszolgáltatók adatai lehetnek a legteljesebbek, de . sajnos cím forrás szempontjából túl teljesek is. Minden pince-, garázssor szerepelhet benne, vagy az olyan speciális címek, mint térfigyelő kamerák, stb.”. Sokszor a címek tisztítása / felismerése is nehéz (pl. Dunaújváros, Béke körút 730 G21/188).

Ceglédbercel, Árpád utca házszám beszúrási pontjai és az interpolált cím beszúrási pontok közötti eltérés.

Ceglédbercel, Árpád utca házszám beszúrási pontjai és az interpolált cím beszúrási pontok közötti eltérés.

A GeoX Kft. Saját, címpontfelhő adatbázisa törekszik a teljességre, de csak egész házszámokat kezel és a koordinátákat lineáris interpolációval állítja elő. Ez a fajta koordináta képzés az egyenetlen telekkiosztások esetében okoz komolyabb eltérést a valós címhely és az interpolált cím koordinátája között. Erre szemléletes példa az alábbi ábra is.

A Lechner Tudásközpont Elérési Hely Adatbázis (EHA) megvásárolható, telek középpontra mutató koordinátával rendelkezik, kezeli az alábontott és -tól -ig típusú házszámokat is (/a, /b, 12-14, …) és minden tétel helyrajzi szám információval van ellátva, de nem tartalmaz épület egyedi koordinátákat, valamint magas arányban van benne „felülvizsgálat alatt” jelölésű cím.

Ceglédbercel esetében a felülvizsgálat alatti címek (piros pötty) aránya 16%.

Ceglédbercel esetében a felülvizsgálat alatti címek (piros pötty) aránya 16%.

A minta adatbázis elkészítésére a megvásárolt EHA adatbázist és a saját címpontfelhőnket vesszük alapul. Űrfelvételek segítségével azonosítjuk, hogy hol szükséges pótolni az EHA adatbázis hiányait GeoX-es címekkel, és az egyes beszúrási pontok utcafrontra igazítása is megoldható a felhasználásukkal.

EHA adatbázis: kék négyzet ikonok / GeoX adatbázis: piros rombusz ikonok

EHA adatbázis: kék négyzet ikonok / GeoX adatbázis: piros rombusz ikonok

Az eredményt a KEKKH lakcím nyilvántartás adatbázis, a nem lakott címeket cégnyilvántartásból és POI adatbázis segítségével ellenőriztük.

Az EHA adatbázis és a KEKKH adatbázis összefésülésének hatékonysága látható az alábbi diagramon.

A lakott címek majdnem 99%-át sikerült a helyszíni felmérés során beazonosítani. Azonban a helyszíni felmérés is megerősítette, hogy a valóságban tényleg vannak duplán (sőt! triplán) kiosztott címek is.

Minden változtatás nélkül a lakott címek közel 88%-a automatikusan megfeleltethető volt EHA adatbázis valid címeivel. A fennmaradó részből dupla EHA címekhez lett rendelve 40 darab (sötétzöld, barna, sötétkék). Majdnem további három százalék (39 cím) teljes egyezőséget mutatott felülvizsgálat alatti címekkel. A felülvizsgálat alatt levő címek közterület írásmódja sajnos nem egységes az EHA adatbázisban. Ezek tisztításával, standardizálásával újabb címek párosíthatók. Fennmarad azonban 81 olyan cím, ami sehogy sem párosítható, csak legközelebbi házszámhoz, vagy hasonló írásmódú házszámhoz (pl. 4/a a 4-hez). A legvégén fennmaradt hat tétel, amelyeket EHA adatbázis közterület szinten sem ismer! A teljes folyamatból nagyjából 150-180 kérdéses cím kerül ki, melyek helyszíni beazonosítást igényelnek.

Nem csak az EHA adatbázist vetettük össze a lakott címekkel, hanem a GeoX-es címeket is. Ennek az összerendelési folyamatnak az eredménye látható a lenti diagramon.

A saját adatbázisunk nem tartalmaz „felülvizsgálat alatti” címeket, duplikátumokat és elírásokat sem, így a csatolást könnyebben el lehetett végezni. Cím2 adatbázis nem tartalmaz házszám alábontást, így a „/a”, „/b” típusú lakcímek eleve nem egyeztek (140 darab). Szerencsére -mivel Ceglédbercel kis település- a házszámok nagy része alábontás nélküli, így majdnem 90% automatikusan párosult. A fennmaradó 13 cím pedig legközelebbi házszámra mutató koordinátát kapott. Ebben az esetben is 150 körül alakult azon címek száma, amelyek helyszíni felmérést igényeltek.

A helyszíni felmérés után az elkészült demo adatbázisra újra futtattuk a lakott címekkel történő összefésülést, és a lenti diagramon látható eredményre jutottunk:

A lakott címek majdnem 99%-át sikerült a helyszíni felmérés során beazonosítani. Azonban a helyszíni felmérés is megerősítette, hogy a valóságban tényleg vannak duplán (sőt! triplán) kiosztott címek is.

Triplán kiosztott cím: Ceglédbercel, Szép utca 69.

Triplán kiosztott cím: Ceglédbercel, Szép utca 69.

A valóság és a lakcímkártyán szereplő címek közötti eltérést 18 esetben sikerült detektálnunk. Több esetben a lakcímnyilvántartás indokolatlanul kezel tól-ig típusú házszámot, a valóságban mind a „tól”, mind az „ig” házszám önállóan szerepel. Másik „típushiba” az érintett 18 lakcím esetében az, hogy KEKKH más alábontást kezel, mint a valóságban található (pl. valóságban 2/a és 2/b található, lakcímként 2/a és 2 b épület szerepel). Utolsó csoportként három olyan címet sikerült elkülönítenünk, amelyek nagy valószínűséggel „beragadt” címek, ahol nem volt semmilyen lakhatásra alkalmas épület.

A lakcímnyilvántartáson túlmenően a megvásárolt cégadatbázist is felhasználtuk az ellenőrzéshez. Mivel Ceglédbercel egy kisebb település, így csupán 68 tételt tartalmazott a cégek adatbázisa. Ráadásul a címek közel fele csupán Ceglédbercel és egy helyrajzi szám típusú volt. A másik sajátossága a céges adatbázisnak, hogy egy adott cég által lefedett minden helyrajzi számot tartalmazta (lásd az alábbi ábra).

Egy adott céghez tartozó „címek” a céges adatbázisból.

Egy adott céghez tartozó „címek” a céges adatbázisból.

A fenti ábrán látható, hogy mind az öt cím egy külterületi helyrajzi szám. Ami még érdekes, hogy a külterület 0133/5 cím hivatalos neve Homokrész tanya 27, mégsem ez szerepelt a cégnyilvántartásban.

A céges adatok összekapcsolását szintén elvégeztük az EHA és a GeoX adatbázisokkal külön-külön egyaránt. Mivel a Cím2 adatbázis nem tartalmaz helyrajzi számokat, így azok közül nem is vártunk találatot. Ellenben az EHA adatbázis minden címhez tartalmaz helyrajzi szám információt is, így itt magas találati arányt vártunk. Sajnos nem így történt. Az EHA adatbázis is leginkább belterületen tartalmaz adatokat, külterületre keveset. A lenti diagramon a két adatbázis találati aránya látható. Szintén az ábrán található az elkészült demo adatbázis találati aránya is.

Céges címek megfeleltetése az egyes forrás adatbázisokkal

Céges címek megfeleltetése az egyes forrás adatbázisokkal

Az elkészült adatbázishoz sem tudtunk két céges címet csatolni. Ennek oka a cégnyilvántartásban szereplő címek helyrajzi szám hibája volt. Ez a két helyrajzi szám vagy megszűnt, vagy olyan mértékben el lett gépelve a rögzítéskor, hogy nem sikerült beazonosítani.

Az elkészült adatbázis egy részlete látható az alábbi képen. Itt a szürke pontok ábrázolják az utcafrontra igazított címeket. A sárga körrel megjelölt szürke körök lakottak is. Kitűnik, hogy az eredeti EHA adatbázisból (világoskék négyzet) hiányzott a lakott 115-ös házszám, a Cím2 adatbázis (piros rombusz) viszont feleslegesen tartalmazta a 113-as címet.

Ceglédbercel egy kis település, aminek helyszíni pontosítása véges erőforrással megoldható volt. Az eredményekből látszik, hogy önmagában az EHA vagy a Cím2 adatbázis is csak 90% alatti pontosságot eredményez, ám a kettőt együtt használva és pontosítva közel 99% érhető el. Nagy sajnálatunkra a helyi szolgáltató nem adta át a saját címadatbázisát, hogy avval is validálhassuk az eredményt.

Országos léptékre kiterjesztve a projektet, kézenfekvő gondolatnak tűnt, hogy a szomszédban található (jóval nagyobb és népesebb) Cegléd településen is körülnézzünk. Itt már vannak lakótelepek és zártkerti ingatlanok is.

A fenti ábrán egy átszámozás maradványa látszik. Eredetileg az „A”, „B”, „C” lépcsőházak egy adott házszám alábontása volt, de a címrendezés miatt Jászberényi út 13., Jászberényi út 15. és Jászberényi út 17. címeket osztottak ki. Ellenben a postaládákon megmaradtak a régi felfestések. Így a helyszíni felmérés során jogosan futunk bele abba a csapdába, hogy a Jászberényi út 13 C cím után keresni kezdjük a Jászberényi út 13 A és 13 B címeket is.

„Szerencsére” vannak előrelátó megoldások is, amikor már rögtön a kapubejáraton két lehetőség közül lehet választani. Mindenki saját szája íze szerint döntheti el, hogy „A” lépcsőházban szeretne lakni, vagy inkább „I.” lépcsőházban.

Egy helyi „nevezetesség” a Csoki ház már önmagában több ellentmondást rejt, mint amit első felméréskor gondoltunk. Az alább látható képen a ház bejáratai és azok címei kerültek feltüntetésre. Megfigyelhető, hogy három közterület is számozódik az épületre.

Az egyik kakukktojás a Szövetség utca plusz bejárata, amiről sajnos nem sikerült megtudni, hogy az 5-ös hátsó bejárata-e, vagy egy olyan közös bejárat, ahonnan mind a három házszám (1., 3., 5.) elérhető.

A másik meglepetés akkor éri az embert, amikor a Földhivatali térképet próbálja segítségül hívni. Azon ugyanis a Szövetség utcai címek meg sem jelennek (lást az alábbi ábra).

A Szövetség utca 1, 3, 5 címek létezését a KEKKH lakcímnyilvántartása alátámassza. Mind a három címre földszinttől a negyedik emeletig közel azonos számú lakás lakott.

A ceglédi kitekintés rávilágít arra, hogy az összetettebb, nagyobb népességű településeken a helyszínen pontosítandó címek aránya jóval magasabb, mint kis települések esetében. A feladat szempontjából a másik érdekes szélsőség a nagy tanyavilággal rendelkező alföldi települések lesznek, ahol a helyszínelés során nagy valószínűséggel nem lesznek láthatók a tanyák számai.