Всем привет, мы снова встретились, я ваш друг Цюаньчжаньцзюнь.
1. Понятие, классификация
данныеОсновная функция системы аналитики — извлечение данных из многочисленных внешних систем.,Сбор данных, связанных с бизнесом,Централизованно хранится в библиотеке данных системы. После того, как система внутренне преобразует все исходные данные посредством ряда процессов.,Затем сохраните его в базовой библиотеке хранилища данных;,Через бизнес необходимо провести серию конвертаций данных в соответствующий базар данных.,Для других компонентов приложения данных верхнего уровня для выполнения тематического анализа или отображения.
Процесс переноса согласно данным,Обычно будут следующие модули:Сбор (получение) данных, хранение данных, расчет данных, анализ данных, отображение данныхи т. д.。Конечно, будут и системные модели, которые на основе этого вносят соответствующие изменения.。
Своевременность согласно анализу данных,我们一般会把大данныеАналитические системы делятся на системы реального времени.、Два типа офлайна。в реальном времениданные Система анализа имеет надежную гарантию своевременности,данные передаются в режиме реального времени,Некоторые соответствующие ситуации анализа также выполняются в режиме реального времени. Автономная система анализа данных больше ориентирована на анализ существующих данных.,Требования к своевременности будут относительно низкими. Все стандарты своевременности основаны на том, что люди могут принять.
2. Система анализа данных журнала трафика веб-сайта
2.1. Системное значение
Статистический анализ данных о трафике веб-сайта может помочь администраторам веб-сайта, операторам, промоутерам и т. д. получать информацию о трафике веб-сайта в режиме реального времени и обеспечивать основу данных для анализа веб-сайта на основе источников трафика, содержания веб-сайта, характеристик посетителей веб-сайта и т. д. Это поможет увеличить посещаемость веб-сайта, улучшить взаимодействие с пользователем, позволит большему количеству посетителей заселиться и стать участниками или клиентами, а также максимизировать доход при меньших инвестициях.
Ø Технически
Вы можете разумно изменить структуру веб-сайта, соответствующим образом распределить ресурсы и создать группу внутренних серверов, например
1. Помощь в улучшении топологии сети и повышении производительности.
2. Организуйте быстрые и эффективные пути доступа между наиболее важными узлами.
3. Помогите предприятиям улучшить дизайн домашних страниц веб-сайтов и организовать веб-контент.
Ø Бизнес
1. Помогите компаниям улучшить маркетинговые решения, например, размещение рекламы на соответствующих веб-страницах.
2. Оптимизируйте дизайн страниц и бизнес-процессов, чтобы повысить коэффициент конверсии трафика.
3. Помогите компаниям лучше организовать контент в соответствии с интересами клиентов.
4. Помогите компаниям сегментировать свою клиентскую базу и разработать персонализированные стратегии продвижения для разных клиентов.
Конечная цель:
Улучшите работу веб-сайта и получите более высокую рентабельность инвестиций (ROI). Это значит зарабатывать больше денег.
2.2. Базовые знания: журналы веб-доступа.
Журналы доступа относятся ко всем данным о доступе, просмотре и кликах, когда пользователи посещают веб-сайт. Например, какая ссылка была нажата, какая страница была открыта, какой поисковый запрос использовался, общее время сеанса и т. д. И всю эту информацию можно сохранить через логи сайта. Анализируя эти данные, вы можете узнать много информации, имеющей решающее значение для работы вашего сайта. Чем полнее собранные данные, тем точнее может быть анализ.
Существует два канала генерации журналов:
Один из них: функция ведения журнала, которая поставляется с программным обеспечением веб-сервера (httpd, nginx, tomcat), например журнал access.log Nginx;
Второй вариант: настроить сбор данных о поведении пользователя, встроить в страницу собственный код Javascript, чтобы получить информацию о поведении пользователя при доступе (например, о положении наведения мыши, нажатых компонентах страницы и т. д.), а затем использовать запрос ajax для записи журнала. на заднем плане Собранная таким образом информация будет более полной.
В реальной работе следующие аспекты данных могут быть собраны в индивидуальном порядке:
Характеристики системы:Например, используемая операционная система、Браузер、Доменное имя и скорость доступа и т. д.
характеристики доступа:включая продолжительность пребывания、Нажатый URL、щелкнул“Теги страниц<a>”и пометить
Свойства и т. д.
Характеристики источника:включая посещенияURL,Посещение ИП и т.д.
Особенности продукта:Укажите номер посещенного продукта、Категория продукта、цвет продукта、Товарыцена、Прибыль от продукта、Количество продукции и специальный уровень цен и т. д.
Если взять в качестве примера компанию электронной коммерции, формат ее журналов данных, собираемых пользователем, следующий:
GET /log.gif?t=item.010001&m=UA-J2011-1&pin=-&uid=1679790178&sid=1679790178|12&v=je=1$sc=24-bit$sr=1600×900$ul=zh-cn$cs=GBK$dt=【Юньнань Байяо Набор】Юньнань Байяо зубная паста 180g×3 (Тип мяты) [Цитаты цитировать цена Обзор】-Цзиндун$hn=item.jd.com$fl=16.0r0$os=win$br=chrome$bv=39.0.2171.95$wb=1437269412$xb=1449548587$yb=1456186252$zb=12$cb=4$usc=direct$ucp=-$umd=none$uct=-$ct=1456186505411$lt=0$tad=-$sku=1326523$cid1=1316$cid2=1384$cid3=1405$brand=20583$pinid=-&ref=&rm=1456186505411 HTTP/1.1 |
---|
Издатель: Лидер стека программистов полного стека, укажите источник для перепечатки: https://javaforall.cn/140514.html Исходная ссылка: https://javaforall.cn