|
Участвуем в развитии проекта m2bomber.com |
+ Додати тему
|
Відповісти на тему
|
Ринок нерухомості. Ціни на квартири та земельні ділянки, аналітика, прогнози. Купівля та продаж нерухомості, оренда квартир та офісів, пропозиції комерційної нерухомості. Ріелтори та агентства нерухомості в Україні
Додано: П'ят 08 тра, 2015 18:46
Faceless написав:Широту/довготу чого саме ви отримали - поштового відділення?
1 Поштового відділення - з точністю в 99% ( там є пару відділень з однаковим індексом і різними адресами) Faceless написав:Це не рівнозначні речі - отримання координат конкретного будинку з прив"язкою до мапи й пошуком по ділянці та отримання координат поштового відділення.
2 Адреси обєкта з точністю яка відповідає точності адресної стрічки - ясно , шо у випадку коли в адресній стрічці відсутній номер будинку , або навіть назва вулиці в селі - то я отримував координати вулиці або села.
Востаннє редагувалось budivelnik в П'ят 08 тра, 2015 18:49, всього редагувалось 1 раз.
-
budivelnik
-
-
- Повідомлень: 26956
- З нами з: 15.01.09
- Подякував: 292 раз.
- Подякували: 2986 раз.
-
-
Профіль
-
-
1
1
Додано: П'ят 08 тра, 2015 18:48
budivelnik написав:2 Адреси обєкта з точністю яка відповідає точності адресної стрічки - ясно , шо у випадку коли в адресній стрічці відсутній номер будинку , або навіть назва вулиці в селі - то я отримував координати вулиці або села.
Якщо в адресній стрічці сміття, назви різними мовами, з помилками, або відсутня взагалі (є тільки район), а адреса є у тексті - то які ваші дії?
-
Faceless
-
- Модератор
-
- Повідомлень: 36575
- З нами з: 24.01.12
- Подякував: 1495 раз.
- Подякували: 8239 раз.
-
-
Профіль
-
-
4
9
3
Додано: П'ят 08 тра, 2015 18:51
Faceless написав: budivelnik написав:2 Адреси обєкта з точністю яка відповідає точності адресної стрічки - ясно , шо у випадку коли в адресній стрічці відсутній номер будинку , або навіть назва вулиці в селі - то я отримував координати вулиці або села.
Якщо в адресній стрічці сміття, назви різними мовами, з помилками - то які ваші дії?
1 Я брав базу тільки по Україні , а українська /російська - не критично 2 Що таке сміття Якщо там На деревню дедушке.... - то ясно що жоден алгоритм не обробить Якщо там переплутані місцями вулиця з містом чи областю - то проблем не виникало. Faceless написав:а адреса є у тексті - то які ваші дії?
Якщо адреса повноцінна . просто десь заниканана то перевіряю чи є в текстовому повідомленні слово яке приблизно дорівнює назві області (25 значень) , якщо область визначається - перехожу до назви населенного пункту з цієї області( ще до 500 значень) , далі до вулиці якщо пройдені перші дві перевірки Всі назви і структура область-населенний пункт -вулиця- є в базі поштових індексів
-
budivelnik
-
-
- Повідомлень: 26956
- З нами з: 15.01.09
- Подякував: 292 раз.
- Подякували: 2986 раз.
-
-
Профіль
-
-
1
1
Додано: П'ят 08 тра, 2015 19:07
budivelnik написав:1 Я брав базу тільки по Україні , а українська /російська - не критично
Коли як, і, ї, є та апострофи і т.п. budivelnik написав:2 Що таке сміття Якщо там На деревню дедушке.... - то ясно що жоден алгоритм не обробить Якщо там переплутані місцями вулиця з містом чи областю - то проблем не виникало.
Найчастіше - у адресній строчці є тільки район, а вулиця - в тексті. Рідше - вказано некоректний район, вулиця знаходится в іншому Або район не вказаний, є тільки вулиця, а в одному місті зустрічаються однакові за назвою вулиці у різних районах Або шлакооб"яви, де перераховано купу об"єктів на різних вулицях у різних районах у одній об"яві. Або вказано не адміністративний район, а місцеву назву Або вказано стару назву вулиці Ну і надодачу - орфографічні помилки budivelnik написав:Якщо адреса повноцінна . просто десь заниканана то перевіряю чи є в текстовому повідомленні слово яке приблизно дорівнює назві області (25 значень) , якщо область визначається - перехожу до назви населенного пункту з цієї області( ще до 500 значень) , далі до вулиці якщо пройдені перші дві перевірки Всі назви і структура область-населенний пункт -вулиця- є в базі поштових індексів
Ідея зрозуміла. Але якщо вулиця складається з двох слів, треба врахувати те, що одне може бути пропущене, скорочене, переставлене місцями, треба врахувати вулиці/провулки/проспекти/бульвари, що мають одну назву, а скорочення типу може бути довільним; номери будинків з буквами/дробами, що можуть бути записані по-різному Одна вулиця може входити до кількох індексів. Який вибір робити, якщо немає номеру будинку? І таки хотів би уточнити: - якщо визначено вулицю, без номеру будинку - координати чого саме ви вказуєте? - а якщо є тільки район? Коли ви берете координати поштового відділення, а коли - безпосередньо будинку?
-
Faceless
-
- Модератор
-
- Повідомлень: 36575
- З нами з: 24.01.12
- Подякував: 1495 раз.
- Подякували: 8239 раз.
-
-
Профіль
-
-
4
9
3
Додано: П'ят 08 тра, 2015 19:20
Faceless написав:Найчастіше - у адресній строчці є тільки район, а вулиця - в тексті. Рідше - вказано некоректний район, вулиця знаходится в іншому Або район не вказаний, є тільки вулиця, а в одному місті зустрічаються однакові за назвою вулиці у різних районах
В межах одного міста - немає вулиць з однаковими назвами ( в крайньому випадку не повинно бути) Faceless написав:Або шлакооб"яви, де перераховано купу об"єктів на різних вулицях у різних районах у одній об"яві.
А навіщо Вам привязувати чітко шлакообявку , якщо це все одно робота рієлтора і він спеціально в обявку забив все що можна , щоб її можна було через гугль витягнути Faceless написав:Або вказано не адміністративний район, а місцеву назву
це найгірше
-
budivelnik
-
-
- Повідомлень: 26956
- З нами з: 15.01.09
- Подякував: 292 раз.
- Подякували: 2986 раз.
-
-
Профіль
-
-
1
1
Додано: П'ят 08 тра, 2015 19:25
Faceless написав:І таки хотів би уточнити: - якщо визначено вулицю, без номеру будинку - координати чого саме ви вказуєте? - а якщо є тільки район? Коли ви берете координати поштового відділення, а коли - безпосередньо будинку?
1 Як правило середину вулиці ( в мене є координати початку і координати закінчення , тому х=(х1+х2)/2 , у=(у1+у2)/2 2 В мене якось не було потреби визначати район , тому треба знайти такі повідомлення щоб подивитись що там проставлено і звідки це взялось , хоча підозрюю , що там також центр району) 3 В мене окремо координати поштового відділення і координати обєкту ( в різних стовпчиках , щоб легше було щось шукати при потребі)
-
budivelnik
-
-
- Повідомлень: 26956
- З нами з: 15.01.09
- Подякував: 292 раз.
- Подякували: 2986 раз.
-
-
Профіль
-
-
1
1
Додано: П'ят 08 тра, 2015 19:31
budivelnik написав:В межах одного міста - немає вулиць з однаковими назвами ( в крайньому випадку не повинно бути)
Я в Києві знаходив до десяти випадків, але зараз довго шукати. budivelnik написав:А навіщо Вам привязувати чітко шлакообявку , якщо це все одно робота рієлтора і він спеціально в обявку забив все що можна , щоб її можна було через гугль витягнути
Питання не у прив"язці, а в тому, як алгоритм обробить такий варіант. Коректно, мабуть, відбракувати. А може воно проставить перший-ліпше підходяще значення? Такі випадки варто розпізнавати. budivelnik написав:це найгірше
Отожбо. А таке дуже часто зустрічається у невеликих населених пунктах, де адміністративний район - один чи два, а "історичних" - зо два десятки. Коли я думав над цим питанням, то умовно-ідеальним рішенням було б створити універсальний довідник, але - це купа роботи та часу на кожен населений пункт - це проблема підтримання актуальності budivelnik написав:1 Як правило середину вулиці ( в мене є координати початку і координати закінчення , тому х=(х1+х2)/2 , у=(у1+у2)/2
Угу, тож довга вулиця через місто видасть вам цікавий результат (от по Львову, вказано Городоцького - це де координати будуть?), а крива вулиця - взагалі унікальний (цілком можливий варіант, що для об"яви на набережній ви помістите об"єкт посеред річки) budivelnik написав:2 В мене якось не було потреби визначати район , тому треба знайти такі повідомлення щоб подивитись що там проставлено і звідки це взялось , хоча підозрюю , що там також центр району)
Тож функціонального тестування не зроблено  budivelnik написав:3 В мене окремо координати поштового відділення і координати обєкту ( в різних стовпчиках , щоб легше було щось шукати при потребі)
Я чогось так і подумав, але як на мене варто б зупинитись на чомусь одному.
-
Faceless
-
- Модератор
-
- Повідомлень: 36575
- З нами з: 24.01.12
- Подякував: 1495 раз.
- Подякували: 8239 раз.
-
-
Профіль
-
-
4
9
3
Додано: П'ят 08 тра, 2015 19:44
Faceless написав:Отожбо.
На мій погляд ви не правильно підходите до вирішення проблеми ( а точніше правильно як програміст - де кома/крапка не в тому місці може привести до збою ) і не правильно як бізнесмен - де відсутнє правило Точність за будь яку ціну і присутнє інше Точність повинна обмежуватись доцільністю. Таким чином Якщо в обяві використані суржик/сленг - то власник цієї обяви без фанатизму віднісся до її заповнення. Поясніть мені - чому Ви повинні безкоштовно виправляти його безалаберність ? Якщо в обяві використані назви вулиць ( у випадку якщо їх кілька однакових в місті)- то як споживач послуги розрізнить що це саме та вулиця яка йому потрібна ? Отже Якщо на вході людина не хоче ( і не прикладає зусиль) щоб видати нормальний продукт - то на виході Ви точно його покращити не зможете - а тому цей 1-5% в сад і не заморочуватись.
-
budivelnik
-
-
- Повідомлень: 26956
- З нами з: 15.01.09
- Подякував: 292 раз.
- Подякували: 2986 раз.
-
-
Профіль
-
-
1
1
Додано: П'ят 08 тра, 2015 19:47
Faceless написав:Тож функціонального тестування не зроблено
Що Ви маєте на увазі під функціональним тестуванням ? Перебір руцями/очима 250000 обєктів ? Мені було достаньо взяти сотню обєктів з допомогою генератора випадкових чисел і переконатись що все відпрацьовано коректно. Faceless написав:Угу, тож довга вулиця через місто видасть вам цікавий результат (от по Львову, вказано Городоцького - це де координати будуть?), а крива вулиця - взагалі унікальний (цілком можливий варіант, що для об"яви на набережній ви помістите об"єкт посеред річки)
Ви хочете і рибку зїсти і нікуди не сісти ? Той хто подавав обяву - написав тільки вулицю і не написав номер. Що я маю робити ? З точки зору математики - це зменшити можливу похибку. Щоб не потрапити в халепу - можна вказати координати початку або кінця - точно не потрапите в річку Щоб зменшити похибку - берете середнє , тоді у Львові , за адресою вул Івана Франка , взявши середнє - потрапите прямо на проспект Шевченка ( на гугль-мапі) але в текстовій стрічці все одно залишиться І Франка без номера.
-
budivelnik
-
-
- Повідомлень: 26956
- З нами з: 15.01.09
- Подякував: 292 раз.
- Подякували: 2986 раз.
-
-
Профіль
-
-
1
1
Додано: П'ят 08 тра, 2015 20:02
budivelnik написав:На мій погляд ви не правильно підходите до вирішення проблеми ( а точніше правильно як програміст - де кома/крапка не в тому місці може привести до збою ) і не правильно як бізнесмен - де відсутнє правило Точність за будь яку ціну і присутнє інше Точність повинна обмежуватись доцільністю. Таким чином Якщо в обяві використані суржик/сленг - то власник цієї обяви без фанатизму віднісся до її заповнення. Поясніть мені - чому Ви повинні безкоштовно виправляти його безалаберність ? Якщо в обяві використані назви вулиць ( у випадку якщо їх кілька однакових в місті)- то як споживач послуги розрізнить що це саме та вулиця яка йому потрібна ? Отже Якщо на вході людина не хоче ( і не прикладає зусиль) щоб видати нормальний продукт - то на виході Ви точно його покращити не зможете - а тому цей 1-5% в сад і не заморочуватись.
Це ваш погляд. А я вам поясню свою точку зору. Якщо йде мова, щоб з певної бази неякісних даних отримати добре структуровану базу якісних даних - то чим краще проведено збагачення та поліпшення даних, тим дорожче оцінюється результат. Звичайно, є рівні, на яких втрачає сенс подальша обробка через надмірну складність та незначний ефект на виході. Але - недоробки, те що зроблено наспіх - не цінується і мало кому потрібне. Тож "за будь-яку ціну" мови не йде, але про якісну роботу - неодмінно. Про доцільність все вірно сказано. Але треба дивитися більш широко: ви зекономите, наприклад, пару місяців роботи, але потім протягом років будете отримувати дохід з недоробки, а для виправлення витратите набагато більше. Або зробите якісно, і продаватимете високоякісний продукт, за який будуть готові платити більше. budivelnik написав:Якщо в обяві використані суржик/сленг - то власник цієї обяви без фанатизму віднісся до її заповнення. Поясніть мені - чому Ви повинні безкоштовно виправляти його безалаберність ?
Чого ж безкоштовно. Я роблю цю послугу для споживача бази - того, що хоче мати змогу враховувати навіть такі об"єкти. budivelnik написав:Якщо в обяві використані назви вулиць ( у випадку якщо їх кілька однакових в місті)- то як споживач послуги розрізнить що це саме та вулиця яка йому потрібна ?
Елементарно - такі вулиці завжди в різних районах, а користувач отримає саме те, що йому потрібно. budivelnik написав:Отже Якщо на вході людина не хоче ( і не прикладає зусиль) щоб видати нормальний продукт - то на виході Ви точно його покращити не зможете - а тому цей 1-5% в сад і не заморочуватись.
Якщо мова про об"яви - на вході людина у більшості випадків не прикладає вдосталь зусиль, але споживачу до того немає діла - він хоче якісний продукт для себе. Ви або "не заморочуєтесь" і не продаєте йому цей продукт, або заморочуєтесь - і продаєте. budivelnik написав:Що Ви маєте на увазі під функціональним тестуванням ? Перебір руцями/очима 250000 обєктів ? Мені було достаньо взяти сотню обєктів з допомогою генератора випадкових чисел і переконатись що все відпрацьовано коректно.
Грубо кажучи - перевірка того, що той алгоритм, що було реалізовано, видає очікуваний результат. Для цього не треба перебирати ані всі, ані більшість об"єктів. Для цього оцінюються можливі варіанти даних на вході, очікуваний результат на виході, і перевіряється, чи воно справді так. budivelnik написав:Ви хочете і рибку зїсти і нікуди не сісти ? Той хто подавав обяву - написав тільки вулицю і не написав номер. Що я маю робити ? З точки зору математики - це зменшити можливу похибку. Щоб не потрапити в халепу - можна вказати координати початку або кінця - точно не потрапите в річку Щоб зменшити похибку - берете середнє , тоді у Львові , за адресою вул Івана Франка , взявши середнє - потрапите прямо на проспект Шевченка ( на гугль-мапі) але в текстовій стрічці все одно залишиться І Франка без номера.
Я задаю питання, щоб зрозуміти, як саме ви підійшли до вирішення задачі. Не більше і не менше.
-
Faceless
-
- Модератор
-
- Повідомлень: 36575
- З нами з: 24.01.12
- Подякував: 1495 раз.
- Подякували: 8239 раз.
-
-
Профіль
-
-
4
9
3
|
+ Додати тему
|
Відповісти на тему
|
Зараз переглядають цей форум: Немає зареєстрованих користувачів і 2 гостей
Модератори:
Faceless, Ірина_, Модератор
Схожі теми
|
|
25 |
28382 |
Чет 03 лют, 2022 20:25 M-A-X
|
|
0 |
3583 |
|
|
Топ відповідей
Топ користувачів
Найкращі відповіді за минулий тиждень
|
|
|