Регрессионный анализ цены квадратного метра и чего-нибудь ещ
+Додати тему
Відповісти на тему
Ринок нерухомості. Ціни на квартири та земельні ділянки, аналітика, прогнози. Купівля та продаж нерухомості, оренда квартир та офісів, пропозиції комерційної нерухомості. Ріелтори та агентства нерухомості в Україні
zahar_ написав:Я так понял Вы считаете для себя приемлемым использовать искажённые данные у себя в рассчётах
Особисто я розумію , що для дона-калюжного , сера шаромижно-дулястого , з спеціальністю рекламний агент-рієлтор всіх крім КГС - за освітою скоріш за все гуманітарій - ази елементарної математики не відомі . Тому беру на себе важку ношу пояснити нашому розжовувачу істин і припускаючому з допусками в 2-3 рази те що відомо будь-якому студенту 1 і вище курсу ВНЗ 1 Якщо є вихідні данні - то на їх підставі будується графік 2 Через будь які дві точки - можна провести пряму 3 Три і більше точок - можна з певною точністю описати математичним рівнянням
Тому Якби в Тайлера були ті данні на які сьогодні спирається наш гуманітарій - він зміг би отримати графік , який практично не відрізнявся б від ним виготовленного на сьогодні.
Тому всі викрики неадеквата , йдуть виклюбчно з того , що він навіть не в стані використати функції . які для гуманітаріїв вбудовані в екселі.
ПС Прохання до Тайлера Додайте на потіху нашому крикуну ще один графік ( до вже двох існуючих інфляція+діапазон сусліка ), який буде базуватись на тих данних які він надибав(діапазон Сусліка2), нехай всі потішаться побачивши що цей крикун : Кричить тільки тому що думати не вміє.
Во-первых, я не хочу делать заведомо бессмысленную работу. Сделать ее - значит признать право любого требовать от меня пересчета в зависимости от личного помутнения.
Во-вторых, результат расчета очевиден - пара "искаженных" недель, даже если Захар прав, а это не так, но даже если бы это было так, то 2 недели на массиве 2.5 года в лучшем для Захара случае понизили бы точность (коэффициент корреляции) на несколько процентов.
В-третьих, для меня совершенно очевидно, что индексы Суслика по определению являются не абсолютными, а относительными цифрами. Равно как и индексы потребительских цен, кстати.
Отсюда вполне очевидный вывод: при сравнении массива относительных цифр самое главное - единый алгоритм расчета. Поэтому для меня последние данные Суслика приоритетны, потому что пересчитаны по единому алгоритму, если я понял автора правильно.
Приведу очевидный пример. Допустим, речь идет об индексе инфляции. При этом, допустим, в расчете фигурируют цены на мобильные телефоны, которые по очевидным причинам становятся все доступнее. Поэтому в определенный момент составители индекса решают уменьшить удельный вес цен на мобильные телефоны и пересчитать индекс задним числом. На месте стыка могут возникнуть резкие колебания индекса и искажение, это логично. Еще логичнее сгладить эти искажения.
Если Баба Яга против - ну что ж, мы переживем. Сглаживание издавна используется для анализа динамики. Рекомендую ознакомиться с таким интересным явлением, как непрерывные фьючерсы.
PS Я, может, как-нибудь из любопытства попробую сделать корреляцию по индексу киевских цен или по индексу домика или мегаквартал, хотя не вижу в этом особой нужды. Славы от этого никакой, один головняк, так о каком мотиве может идти речь?
Востаннє редагувалось Tyler в Вів 09 жов, 2012 12:32, всього редагувалось 1 раз.
PS вообще-то все это легко можно скачать в базе Суслика, если что.
PPS предвосхищаю вопрос о том, были или не были пересчитаны по алгоритму Суслика индексы в 2010 - в деле пересчета задним числом самое проблемное - это стык двух методик. Поэтому, если Суслику удалось найти время стыка (насколько я его понял, это был декабрь 2010), в котором данные индексы по двум методикам почти совпали, если не считать первой недели января 2011, то нет проблемы в том, чтобы индексы 2010 были посчитаны по-старому.
Наверное, было бы полезно увидеть обновление индексов еще на год назад до начала 2010 -я бы с интересом посмотрел на это, но кто может принудить к этому автора базы?
Tyler написав: есть официальные индексы цен и есть база индексов авизо, посчитанная по единому алгоритму.
Вас не затруднит выложить понедельно индексы вторничных номеров из базы Суслика за 2010 год?
И еще одно, очевидно необходимое разъяснение. Я не пытался спрогнозировать цену метра своей моделью. Я хотел найти зависимость цены метра от какого-нибудь макропоказателя. Разницу улавливаете? Не надо об этом забывать!
Допустим, условный автор базы изменил методику/алгоритм и в январе вместо индекса цены метра, равной 1600, стало 1700 (или наоборот, это неважно). С точки зрения абсолютной цифры это катастрофа -как же так, было 1600, стало 1700!
Но если в старой базе было в декабре 1650, а в феврале - 1550, а в новой, соответственно, стало в декабре 1750 и в феврале 1650, то с точки зрения динамики ничего не изменилось, а для модели корреляции нет ничего важнее динамики (можно, конечно, позанудствовать и придраться: типа, 1750/1700 меньше, чем 1650/1600 аж на десятые доли процента, что, разумеется, совершенно критично )
Действительно ли новая модель повторяет динамику старой - это, конечно, вопрос, но для нас отличия в абсолютных цифрах вторичны по сравнению с изменениями этих абсолютных цифр.
Старая модель построения индекса полностью оправдывала себя до 2011 года, поскольку тренд движения был достаточно ощутимым и потому диапазон отбора цены кв.м от 10 до 10000 не сильно влиял на общую статистику и определение индекса при ниспадающей динамике. С начала 2011 года индекс на этой модели начало "бросать", что и заметили здесь на ветке, как необоснованные скачки. Это случилось из-за того, что индекс перешел в горизонтальную плоскость и на его значения все больше стало влиять количество объектов у нижней или верхней планки диапазона. Именно поэтому и возникла необходимость в корректировке модели, а именно сУжении доверительного диапазона от 200 до 3500. И данный пересчет "выровнял" неадекватные (скорее технические или манипулятивные) скачки индекса. Эту модель применять на более ранние отрезки времени не рекомендуется, потому как в раннее время цена за кв.м и более 3500 считалась адекватной, а для сегоднешнего рынка это уже фантастика. Так что в определенные моменты времени иногда необходимы некоторые корректировки модели, поскольку старые правила перестают действовать и индекс уже не соответствует действительности. Именно потому я и взял на себя смелость откорректировать модель, подогнав точку соприкосновения под ежегодную январскую "яму" - 11.01.2011 по старой модели уже был подъем, относительно прошлого значения. По новой методике уже тоже пошел подъем индекса, но он все равно оказался ниже нижнего индекса старой модели. Т.е. эта дата именно и есть точкой перехода между моделями.
tsnakeman , еще раз уточним, правильно ли я понимаю:
1. Изменение алгоритма призвано уменьшить влияние заведомо неадекватных хотелок (слишком низких и слишком высоких)?
2. Момент "стыка" двух алгоритмов выбран таким образом, что на индексах декабря 2010 разница почти не заметна, и только начало января 2011 пришлось "сгладить" -период 1-2 недели максимум.
3. Моделирование с помощью общей базы индексов за период с января 2010 по сегодняшний день является корректным, потому что изменение алгоритма было вызвано уменьшением диапазона волатильности цен, начиная с 2011 года.
Грубо говоря, алгоритм расчета в 2010м году позволял вычислять индекс с бОльшей точностью за счет более явного тренда, а позже такая точность привела к искажениям и пришлось понизить "приближение". Смысла задним числом снижать это "приближение" в 2010м году нет, а использовать цепь непрерывных индексов 2010-2012 можно.
Tyler написав:tsnakeman , еще раз уточним, правильно ли я понимаю:
1. Изменение алгоритма призвано уменьшить влияние заведомо неадекватных хотелок (слишком низких и слишком высоких)?
2. Момент "стыка" двух алгоритмов выбран таким образом, что на индексах декабря 2010 разница почти не заметна, и только начало января 2011 пришлось "сгладить" -период 1-2 недели максимум.
3. Моделирование с помощью общей базы индексов за период с января 2010 по сегодняшний день является корректным, потому что изменение алгоритма было вызвано уменьшением диапазона волатильности цен, начиная с 2011 года.
Грубо говоря, алгоритм расчета в 2010м году позволял вычислять индекс с бОльшей точностью за счет более явного тренда, а позже такая точность привела к искажениям и пришлось понизить "приближение". Смысла задним числом снижать это "приближение" в 2010м году нет, а использовать цепь непрерывных индексов 2010-2012 можно.
Я правильно понял?
1. да, но лишь потому, что переходе индекса в горизонтальную плоскость эти процессы начали оказывать существенное влияние на индекс. Ранее они были незаметны из-за более высоких цен и ярко выраженной динамики рынка. 2. 11.01.2011 - это уже индекс по новой модели. Никакого дополнительного сглаживания я не делал - это четкая граница, просто она совпала с сезонными процессами и потому на графике ее не особо заметно. 3.Да - тенденциии и динамика рынка сохранена корректно. Единственно, если хочется четче привязаться к цифрам, то прибавьте корректировку в 50$ ко всем значениям БД, начиная с 11.01.2011 - примерно настолько опустилась планка среднего индексе после применения новой модели. Но поскольку значения индекса относительны, а главное значение - динамика, то она отображена корректно, просто январская "яма" 2011 получилась глубже на 50 долларов.
для интереса подкрутите вверх ставку и посмотрите, что станет с инфляцией (а также с безработицей (которая, в принципе, прямо коррелиррует с ростом ввп, который, так или иначе, влияет на цену недвижимости).
Tyler написав:tsnakeman , еще раз уточним, правильно ли я понимаю:
1. Изменение алгоритма призвано уменьшить влияние заведомо неадекватных хотелок (слишком низких и слишком высоких)?
2. Момент "стыка" двух алгоритмов выбран таким образом, что на индексах декабря 2010 разница почти не заметна, и только начало января 2011 пришлось "сгладить" -период 1-2 недели максимум.
3. Моделирование с помощью общей базы индексов за период с января 2010 по сегодняшний день является корректным, потому что изменение алгоритма было вызвано уменьшением диапазона волатильности цен, начиная с 2011 года.
Грубо говоря, алгоритм расчета в 2010м году позволял вычислять индекс с бОльшей точностью за счет более явного тренда, а позже такая точность привела к искажениям и пришлось понизить "приближение". Смысла задним числом снижать это "приближение" в 2010м году нет, а использовать цепь непрерывных индексов 2010-2012 можно.
Я правильно понял?
1. да, но лишь потому, что переходе индекса в горизонтальную плоскость эти процессы начали оказывать существенное влияние на индекс. Ранее они были незаметны из-за более высоких цен и ярко выраженной динамики рынка. 2. 11.01.2011 - это уже индекс по новой модели. Никакого дополнительного сглаживания я не делал - это четкая граница, просто она совпала с сезонными процессами и потому на графике ее не особо заметно. 3.Да - тенденциии и динамика рынка сохранена корректно. Единственно, если хочется четче привязаться к цифрам, то прибавьте корректировку в 50$ ко всем значениям БД, начиная с 11.01.2011 - примерно настолько опустилась планка среднего индексе после применения новой модели. Но поскольку значения индекса относительны, а главное значение - динамика, то она отображена корректно, просто январская "яма" 2011 получилась глубже на 50 долларов.
В общем корректно, но откорректированные индексы не показали в частности "загон" пузыренадувателей в январе, феврале 2011
Данные Тайлера по откорректированым индексам дата _______ ср.стоимость метра___________ ср.стоимость метра 05.01.2011 _____________ 1712 _____________ 11.01.2011 _____________ 1659 _____________ 18.01.2011 _____________ 1663 _____________ 25.01.2011 _____________ 1672 _____________ 1676.5 средняя за январь 2011 01.02.2011 _____________ 1687 _____________ 08.02.2011 _____________ 1671 _____________ 15.02.2011 _____________ 1673 _____________ средняя за февраль 2011 22.02.2011 _____________ 1671 _____________ 1675.5
А вот что показывали в то время индексы посчитанные по преведущиму алгоритму. дата _______ ср.стоимость метра___________ ср.стоимость метра 05.01.2011 _____________ 1712 _____________ 11.01.2011 _____________ 1755 _____________ 18.01.2011 _____________ 1773 _____________ 25.01.2011 _____________ 1786 _____________ 1756 средняя за январь 2011 01.02.2011 _____________ 1798 _____________ 08.02.2011 _____________ 1779 _____________ 15.02.2011 _____________ 1767 _____________ средняя за февраль 2011 22.02.2011 _____________ 1777 _____________ 1780
Откорректированые индексы "потеряли" "загон" риелтор в январе феврале, когда ни с того ни с его тренд по Авизо в феврале развернулся и показал рост на на 1.36%
То есть по динамике цифр того времени "доктрина тайлера" - инфляция растёт цены падают - не работала ни в январе, ни в феврале 2011.