Участвуем в развитии проекта m2bomber.com

+ Додати
    тему
Відповісти
на тему
Ринок нерухомості. Ціни на квартири та земельні ділянки, аналітика, прогнози. Купівля та продаж нерухомості, оренда квартир та офісів, пропозиції комерційної нерухомості. Ріелтори та агентства нерухомості в Україні
  #<1 ... 5657585960 ... 192>
Повідомлення Додано: П'ят 08 тра, 2015 20:11

  Faceless написав:Якщо йде мова, щоб з певної бази неякісних даних отримати добре структуровану базу якісних даних - то чим краще проведено збагачення та поліпшення даних, тим дорожче оцінюється результат.
Але при цьому Ви повинні погодитись
Покращити структуру подання данних Ви можете тільки в тому випадку коли ці данні - є , просто вони розкидані.
Тобто для отримання результату - потрібні надлищкові данні.
У випадку , коли данні недостані...
Відсутні номера будинків , або відсутні райони у вулиць з однаковими назвами ( завтра напишу макросик щоб прошерстити вулиці Києва і побачити де там однакові назви вулиць) - то жоден алгоритм буде не в змозі їх покращити.
Тому в цьому випадку ( недостатності данних) потрібно покладатись не на алгоритм а на зворотній звязок з людиною яка подала обяву з проханням уточнити данні.
Тільки тоді Ви отримаєте дійсно продукт який можна буде продавати
У всіх інших випадках , цей продукт буде нести в собі всі хвороби притаманні первинному джерелу а якщо бути точнішим то це буде набір хвороб з кожного первинного джерела з непрогнозованими мутаціями.
Востаннє редагувалось budivelnik в П'ят 08 тра, 2015 20:15, всього редагувалось 1 раз.
budivelnik
Аватар користувача
 
Повідомлень: 26967
З нами з: 15.01.09
Подякував: 292 раз.
Подякували: 2986 раз.
 
Профіль
 
1
1
Повідомлення Додано: П'ят 08 тра, 2015 20:15

Re: учавствуем в развитии проекта m2bomber.com - объявления

  budivelnik написав:Тобто для отримання результату - потрібні надлищкові данні.

Насправді даних набагато більше, ніж вам здається - просто треба вміти їх видобути
Faceless
Аватар користувача
Модератор
 
Повідомлень: 36575
З нами з: 24.01.12
Подякував: 1495 раз.
Подякували: 8239 раз.
 
Профіль
 
4
9
3
Повідомлення Додано: П'ят 08 тра, 2015 20:18

  Faceless написав:
  budivelnik написав:Тобто для отримання результату - потрібні надлищкові данні.
Насправді даних набагато більше, ніж вам здається - просто треба вміти їх видобути
Ви б якось визначились
Мене критикуєте за відсутність алгоритму обробки коли відсутній номер будинку - і одночасно заявляєте про наявність надлишкових данних.
Можливо фраза в повідомленні типу
вулиця Леніна , другий поворот від пивбару - це і надлишкова інформація , яка дозволить при потребі визначити номер будинку , але я точно знаю що вартість визначення буде на порядок більша від прибутку який згенерує подібна обява.

Пс
На протязі кількох днів , я можу визначити всі відомі гугль-мапу адреси Києва з точними привязками у форматі ( можу й усі адреси України ... але тут вже точно не безкоштовно)
вулиця-номер будинку-широта-довгота
Якщо Вам це необхідно - звертайтесь :D
Тільки я не знаю що це Вам дасть, якщо у повідомленнях які Ви стягуєте з різних ресурсів будуть відсутні 50% приведених мною параметрів
budivelnik
Аватар користувача
 
Повідомлень: 26967
З нами з: 15.01.09
Подякував: 292 раз.
Подякували: 2986 раз.
 
Профіль
 
1
1
Повідомлення Додано: П'ят 08 тра, 2015 21:51

  Faceless написав:
  budivelnik написав:В межах одного міста - немає вулиць з однаковими назвами ( в крайньому випадку не повинно бути)

Я в Києві знаходив до десяти випадків, але зараз довго шукати.


проспект Гонгадзе (Веник) и улица Гонгадзе (Соломянка)
baraka
 
Повідомлень: 5475
З нами з: 09.10.12
Подякував: 920 раз.
Подякували: 881 раз.
 
Профіль
 
Повідомлення Додано: П'ят 08 тра, 2015 21:57

  Faceless написав:
  budivelnik написав:
  Faceless написав:Цей пункт - він у вас автоматизований?
Так
Ви б повинні були зрозуміти , що якщо я отримав довготу/широту в автоматичному режимі , то після цього отримати правильну адресу цієї довготи/широти - як два пальці....

Ви ж працювали з індексами. Широту/довготу чого саме ви отримали - поштового відділення?


географические координаты почтовых отделений. Но не вижу смысла их заюзывать если есть более точные данные с точностью "до дома" (с опенстритмап). Ну и плюс опенстрит мап должна покрыть все страны которые есть (и которые будут).

Faceless, возможно вы поняли смысл того что делает будивельнык ? Я до сих пор - нет :(
baraka
 
Повідомлень: 5475
З нами з: 09.10.12
Подякував: 920 раз.
Подякували: 881 раз.
 
Профіль
 
Повідомлення Додано: Суб 09 тра, 2015 14:01

  baraka написав:
  Faceless написав:Ви ж працювали з індексами. Широту/довготу чого саме ви отримали - поштового відділення?
географические координаты почтовых отделений. Но не вижу смысла их заюзывать если есть более точные данные с точностью "до дома" (с опенстритмап). Ну и плюс опенстрит мап должна покрыть все страны которые есть (и которые будут).
Кілька разів писав
Коли в людини гормони і амбіції зашкалюють - то це затуманює розум до такої степені що людина перетворюється в засмиканого і рознервованого звірка.
1 Повторюю вже як мінімум третій раз тільки на цій гілочці
В мене є географічні координати 99% обєктів які присутні в базі данних бомбера в розділах продаж нерухомості в Україні станом на 01-05-2015 .
2 Точність цих координат - відповідає точності опису адреси.
Якщо в адресі тільки
область - то це центр області
Місто - центр міста
вулиця -центр вулиці
номер будинку - центр будинку
Навіть якщо ці значення були в текстовій частині повідомлення.
3 Я знаю , як отримати географічні координати всіх споруд які мають поштові адреси і які відомі гугль-мапу.
Складність отримання по Києву - приблизно 2 тижні ( два дні роботи над програмулькою і 14 днів тупе скачування)
Складність отримання по Україні - ще тиждень

Звідси висновок
1 Я роблю те що мені цікаво і при цьому на 90% впевнений що комерційної привабливості для мене в цій роботі немає
2 Мене не цікавить признання програміста який прикриваючись резюме пробує довести що його робота вартує 6-місячній оплаті і при цьому умудряється наплювати в колодязь , з якого сам міг пити.
3 Так як я знаю , що людина найкраще працює там де їй щось потрібно , то моя робота спрямована на те щоб прищаві вискочки навчились стримувати свої гормоно/амбіції заради отримання потрібного їм результату.
  baraka написав:Faceless, возможно вы поняли смысл того что делает будивельнык ? Я до сих пор - нет :(
Якщо хтось не розуміє що робить інший.
То це швидше говорить про тупість того хто не розуміє ніж про відсутність розуму в того хто робить
Востаннє редагувалось budivelnik в Суб 09 тра, 2015 14:12, всього редагувалось 1 раз.
budivelnik
Аватар користувача
 
Повідомлень: 26967
З нами з: 15.01.09
Подякував: 292 раз.
Подякували: 2986 раз.
 
Профіль
 
1
1
Повідомлення Додано: Суб 09 тра, 2015 14:09

  baraka написав:
  Faceless написав:
  budivelnik написав:В межах одного міста - немає вулиць з однаковими назвами ( в крайньому випадку не повинно бути)
Я в Києві знаходив до десяти випадків, але зараз довго шукати.
проспект Гонгадзе (Веник) и улица Гонгадзе (Соломянка)
Дав запит вулиці Києва, зайшов у вікіпедію і отримав
Проблема тільки з вулицею Садова і лініями - якщо в адресній стрічці не буде вказаний район то інтендифікувати їх буде досить складно
У всіх інших випадках однакові назви є , але вони відносяться до різних типів (провулок,вулиця,проспект) - що їх чітко інтендифікує.
budivelnik
Аватар користувача
 
Повідомлень: 26967
З нами з: 15.01.09
Подякував: 292 раз.
Подякували: 2986 раз.
 
Профіль
 
1
1
Повідомлення Додано: Суб 09 тра, 2015 14:39

  budivelnik написав:2 Точність цих координат - відповідає точності опису адреси.
Якщо в адресі тільки
область - то це центр області
Місто - центр міста
вулиця -центр вулиці
номер будинку - центр будинку
Навіть якщо ці значення були в текстовій частині повідомлення.


что делать если в адресе один адрес, а в заголовке/тексте другой ?
я правильно понимаю что вы скармливаете все эти данные гуглю ?
как вы обходите гугловый лимит на 3000 запросов в сутки?

  budivelnik написав:3 Я знаю , як отримати географічні координати всіх споруд які мають поштові адреси і які відомі гугль-мапу.


я тоже знаю и это пыло первой моей мыслью (и я об этом писал тут). К сожалению - юзать гугл в данном случае не самое лучшее решение.

Поэтому остановился на опенстритмап (это более верно с точки зрения зависимостей и архитектуры). Кроме того опенстритмап позволит мне создать точные словарики улиц/городов и т.д (я не пропущу чего-то + искажённая инфа не попадёт в словарики)
Востаннє редагувалось baraka в Суб 09 тра, 2015 14:58, всього редагувалось 3 разів.
baraka
 
Повідомлень: 5475
З нами з: 09.10.12
Подякував: 920 раз.
Подякували: 881 раз.
 
Профіль
 
Повідомлення Додано: Суб 09 тра, 2015 14:41

  budivelnik написав:2 Мене не цікавить признання програміста який прикриваючись резюме пробує довести що його робота вартує 6-місячній оплаті


так чего ж вы опираетесь тогда на результаты моей работы ? взяли бы тогда для чистоты эксперимента все исходники объявлений со всех истончников, и сами бы с нуля обрабатывали, обходили crawling-фильтры, обрабатывали фото с номерами телефонов, "клеили" объекты, обновляли их статус, сделали возможность внятного поиска и т.д.
Слабо? :mrgreen:
Востаннє редагувалось baraka в Суб 09 тра, 2015 14:48, всього редагувалось 2 разів.
baraka
 
Повідомлень: 5475
З нами з: 09.10.12
Подякував: 920 раз.
Подякували: 881 раз.
 
Профіль
 
Повідомлення Додано: Суб 09 тра, 2015 14:45

будивельнык, ну ок - ну получили вы точные координаты объектов.

Что дальше ? Чем ваши координаты сделают вашу копию базы (уже устаревшую, кстати) более интересной ?
baraka
 
Повідомлень: 5475
З нами з: 09.10.12
Подякував: 920 раз.
Подякували: 881 раз.
 
Профіль
 
  #<1 ... 5657585960 ... 192>
Форум:
+ Додати
    тему
Відповісти
на тему
Зараз переглядають цей форум: Ana і 1 гість
Модератори: Faceless, Ірина_, Модератор

Схожі теми

Теми
Відповіді Перегляди Останнє
25 28382
Переглянути останнє повідомлення
Чет 03 лют, 2022 20:25
M-A-X
0 3583
Переглянути останнє повідомлення
Сер 12 кві, 2017 14:12
Рыба-сом
Топ
відповідей
Топ
користувачів
реклама
Реклама