|
Участвуем в развитии проекта m2bomber.com |
+ Додати тему
|
Відповісти на тему
|
Ринок нерухомості. Ціни на квартири та земельні ділянки, аналітика, прогнози. Купівля та продаж нерухомості, оренда квартир та офісів, пропозиції комерційної нерухомості. Ріелтори та агентства нерухомості в Україні
Додано: П'ят 08 тра, 2015 20:11
Faceless написав:Якщо йде мова, щоб з певної бази неякісних даних отримати добре структуровану базу якісних даних - то чим краще проведено збагачення та поліпшення даних, тим дорожче оцінюється результат.
Але при цьому Ви повинні погодитись Покращити структуру подання данних Ви можете тільки в тому випадку коли ці данні - є , просто вони розкидані. Тобто для отримання результату - потрібні надлищкові данні. У випадку , коли данні недостані... Відсутні номера будинків , або відсутні райони у вулиць з однаковими назвами ( завтра напишу макросик щоб прошерстити вулиці Києва і побачити де там однакові назви вулиць) - то жоден алгоритм буде не в змозі їх покращити.Тому в цьому випадку ( недостатності данних) потрібно покладатись не на алгоритм а на зворотній звязок з людиною яка подала обяву з проханням уточнити данні. Тільки тоді Ви отримаєте дійсно продукт який можна буде продавати У всіх інших випадках , цей продукт буде нести в собі всі хвороби притаманні первинному джерелу а якщо бути точнішим то це буде набір хвороб з кожного первинного джерела з непрогнозованими мутаціями.
Востаннє редагувалось budivelnik в П'ят 08 тра, 2015 20:15, всього редагувалось 1 раз.
-
budivelnik
-
-
- Повідомлень: 26956
- З нами з: 15.01.09
- Подякував: 292 раз.
- Подякували: 2986 раз.
-
-
Профіль
-
-
1
1
Додано: П'ят 08 тра, 2015 20:15
budivelnik написав:Тобто для отримання результату - потрібні надлищкові данні.
Насправді даних набагато більше, ніж вам здається - просто треба вміти їх видобути
-
Faceless
-
- Модератор
-
- Повідомлень: 36575
- З нами з: 24.01.12
- Подякував: 1495 раз.
- Подякували: 8239 раз.
-
-
Профіль
-
-
4
9
3
Додано: П'ят 08 тра, 2015 20:18
Faceless написав: budivelnik написав:Тобто для отримання результату - потрібні надлищкові данні.
Насправді даних набагато більше, ніж вам здається - просто треба вміти їх видобути
Ви б якось визначились Мене критикуєте за відсутність алгоритму обробки коли відсутній номер будинку - і одночасно заявляєте про наявність надлишкових данних. Можливо фраза в повідомленні типу вулиця Леніна , другий поворот від пивбару - це і надлишкова інформація , яка дозволить при потребі визначити номер будинку , але я точно знаю що вартість визначення буде на порядок більша від прибутку який згенерує подібна обява. Пс На протязі кількох днів , я можу визначити всі відомі гугль-мапу адреси Києва з точними привязками у форматі ( можу й усі адреси України ... але тут вже точно не безкоштовно) вулиця-номер будинку-широта-довгота Якщо Вам це необхідно - звертайтесь Тільки я не знаю що це Вам дасть, якщо у повідомленнях які Ви стягуєте з різних ресурсів будуть відсутні 50% приведених мною параметрів
-
budivelnik
-
-
- Повідомлень: 26956
- З нами з: 15.01.09
- Подякував: 292 раз.
- Подякували: 2986 раз.
-
-
Профіль
-
-
1
1
Додано: П'ят 08 тра, 2015 21:51
Faceless написав: budivelnik написав:В межах одного міста - немає вулиць з однаковими назвами ( в крайньому випадку не повинно бути)
Я в Києві знаходив до десяти випадків, але зараз довго шукати.
проспект Гонгадзе (Веник) и улица Гонгадзе (Соломянка)
-
baraka
-
-
- Повідомлень: 5475
- З нами з: 09.10.12
- Подякував: 920 раз.
- Подякували: 881 раз.
-
-
Профіль
-
-
Додано: П'ят 08 тра, 2015 21:57
Faceless написав: budivelnik написав: Faceless написав:Цей пункт - він у вас автоматизований?
Так Ви б повинні були зрозуміти , що якщо я отримав довготу/широту в автоматичному режимі , то після цього отримати правильну адресу цієї довготи/широти - як два пальці....
Ви ж працювали з індексами. Широту/довготу чого саме ви отримали - поштового відділення?
географические координаты почтовых отделений. Но не вижу смысла их заюзывать если есть более точные данные с точностью "до дома" (с опенстритмап). Ну и плюс опенстрит мап должна покрыть все страны которые есть (и которые будут). Faceless, возможно вы поняли смысл того что делает будивельнык ? Я до сих пор - нет 
-
baraka
-
-
- Повідомлень: 5475
- З нами з: 09.10.12
- Подякував: 920 раз.
- Подякували: 881 раз.
-
-
Профіль
-
-
Додано: Суб 09 тра, 2015 14:01
baraka написав: Faceless написав:Ви ж працювали з індексами. Широту/довготу чого саме ви отримали - поштового відділення?
географические координаты почтовых отделений. Но не вижу смысла их заюзывать если есть более точные данные с точностью "до дома" (с опенстритмап). Ну и плюс опенстрит мап должна покрыть все страны которые есть (и которые будут).
Кілька разів писав Коли в людини гормони і амбіції зашкалюють - то це затуманює розум до такої степені що людина перетворюється в засмиканого і рознервованого звірка. 1 Повторюю вже як мінімум третій раз тільки на цій гілочці В мене є географічні координати 99% обєктів які присутні в базі данних бомбера в розділах продаж нерухомості в Україні станом на 01-05-2015 . 2 Точність цих координат - відповідає точності опису адреси. Якщо в адресі тільки область - то це центр області Місто - центр міста вулиця -центр вулиці номер будинку - центр будинку Навіть якщо ці значення були в текстовій частині повідомлення. 3 Я знаю , як отримати географічні координати всіх споруд які мають поштові адреси і які відомі гугль-мапу. Складність отримання по Києву - приблизно 2 тижні ( два дні роботи над програмулькою і 14 днів тупе скачування) Складність отримання по Україні - ще тиждень Звідси висновок 1 Я роблю те що мені цікаво і при цьому на 90% впевнений що комерційної привабливості для мене в цій роботі немає 2 Мене не цікавить признання програміста який прикриваючись резюме пробує довести що його робота вартує 6-місячній оплаті і при цьому умудряється наплювати в колодязь , з якого сам міг пити. 3 Так як я знаю , що людина найкраще працює там де їй щось потрібно , то моя робота спрямована на те щоб прищаві вискочки навчились стримувати свої гормоно/амбіції заради отримання потрібного їм результату. baraka написав:Faceless, возможно вы поняли смысл того что делает будивельнык ? Я до сих пор - нет 
Якщо хтось не розуміє що робить інший. То це швидше говорить про тупість того хто не розуміє ніж про відсутність розуму в того хто робить
Востаннє редагувалось budivelnik в Суб 09 тра, 2015 14:12, всього редагувалось 1 раз.
-
budivelnik
-
-
- Повідомлень: 26956
- З нами з: 15.01.09
- Подякував: 292 раз.
- Подякували: 2986 раз.
-
-
Профіль
-
-
1
1
Додано: Суб 09 тра, 2015 14:09
baraka написав: Faceless написав: budivelnik написав:В межах одного міста - немає вулиць з однаковими назвами ( в крайньому випадку не повинно бути)
Я в Києві знаходив до десяти випадків, але зараз довго шукати.
проспект Гонгадзе (Веник) и улица Гонгадзе (Соломянка)
Дав запит вулиці Києва, зайшов у вікіпедію і отримав Проблема тільки з вулицею Садова і лініями - якщо в адресній стрічці не буде вказаний район то інтендифікувати їх буде досить складно У всіх інших випадках однакові назви є , але вони відносяться до різних типів (провулок,вулиця,проспект) - що їх чітко інтендифікує.
-
budivelnik
-
-
- Повідомлень: 26956
- З нами з: 15.01.09
- Подякував: 292 раз.
- Подякували: 2986 раз.
-
-
Профіль
-
-
1
1
Додано: Суб 09 тра, 2015 14:39
budivelnik написав:2 Точність цих координат - відповідає точності опису адреси. Якщо в адресі тільки область - то це центр області Місто - центр міста вулиця -центр вулиці номер будинку - центр будинку Навіть якщо ці значення були в текстовій частині повідомлення.
что делать если в адресе один адрес, а в заголовке/тексте другой ? я правильно понимаю что вы скармливаете все эти данные гуглю ? как вы обходите гугловый лимит на 3000 запросов в сутки? budivelnik написав:3 Я знаю , як отримати географічні координати всіх споруд які мають поштові адреси і які відомі гугль-мапу.
я тоже знаю и это пыло первой моей мыслью (и я об этом писал тут). К сожалению - юзать гугл в данном случае не самое лучшее решение. Поэтому остановился на опенстритмап (это более верно с точки зрения зависимостей и архитектуры). Кроме того опенстритмап позволит мне создать точные словарики улиц/городов и т.д (я не пропущу чего-то + искажённая инфа не попадёт в словарики)
Востаннє редагувалось baraka в Суб 09 тра, 2015 14:58, всього редагувалось 3 разів.
-
baraka
-
-
- Повідомлень: 5475
- З нами з: 09.10.12
- Подякував: 920 раз.
- Подякували: 881 раз.
-
-
Профіль
-
-
Додано: Суб 09 тра, 2015 14:41
budivelnik написав:2 Мене не цікавить признання програміста який прикриваючись резюме пробує довести що його робота вартує 6-місячній оплаті
так чего ж вы опираетесь тогда на результаты моей работы ? взяли бы тогда для чистоты эксперимента все исходники объявлений со всех истончников, и сами бы с нуля обрабатывали, обходили crawling-фильтры, обрабатывали фото с номерами телефонов, "клеили" объекты, обновляли их статус, сделали возможность внятного поиска и т.д. Слабо? 
Востаннє редагувалось baraka в Суб 09 тра, 2015 14:48, всього редагувалось 2 разів.
-
baraka
-
-
- Повідомлень: 5475
- З нами з: 09.10.12
- Подякував: 920 раз.
- Подякували: 881 раз.
-
-
Профіль
-
-
Додано: Суб 09 тра, 2015 14:45
будивельнык, ну ок - ну получили вы точные координаты объектов.
Что дальше ? Чем ваши координаты сделают вашу копию базы (уже устаревшую, кстати) более интересной ?
-
baraka
-
-
- Повідомлень: 5475
- З нами з: 09.10.12
- Подякував: 920 раз.
- Подякували: 881 раз.
-
-
Профіль
-
-
|
+ Додати тему
|
Відповісти на тему
|
Зараз переглядають цей форум: BIGor і 2 гостей
Модератори:
Faceless, Ірина_, Модератор
Схожі теми
|
|
25 |
28382 |
Чет 03 лют, 2022 20:25 M-A-X
|
|
0 |
3583 |
|
|
Топ відповідей
Топ користувачів
Найкращі відповіді за минулий тиждень
|
|
|