Strong-stuff.ru

Образование Онлайн
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Анализ данных книги

12 книг по Data Science для новичков и продвинутых

Редактор блога Нетологии Юлия Чернова сделала подборку книг о Data Science на английском языке, которые помогут новичкам разобраться в основах, а продвинутым — прокачать знания и навыки.

«Numsense! Data Science for the Layman», Annalyn Ng, Kenneth Soo

Для кого. Для новичков в сфере Data Science, которые знают английский.

О чем. Автор описывает регрессивный анализ, нейронные сети А/В тесты, деревья решений и другие базовые понятия.

Польза. Поможет вникнуть в основы DS без математической сложности, разобраться в теме при помощи наглядных иллюстраций.

«Machine Learning», Tom Mitchell

Для кого. Для новичков, которые не знают ничего об искусственном интеллекте и статистике. Для владеющих английским на продвинутом уровне.

О чем. Описания популярных алгоритмов — байесовского обучения, обучения с подкреплением, нейронных сетей с подробными примерами.

Польза. Лучший вводный материал для тех кто изучает элементарные понятия машинного обучения. Поможет разобраться в теме и понять основы перед дальнейшим углубленным изучением.

«Blockchain Basics: A Non-Technical Introduction in 25 Steps», Daniel Drescher

Для кого. Для новичков, которые не хотят разбираться с терминами из программирования и знают английский.

О чем. Книга о технологии блокчейн на примерах криптовалют Bitcoin, Ethereum и Litecoin.

Польза. Доступно объясняет, что такое блокчейн, без сложных технических терминов, с примерами и иллюстрациями.

«Microsoft Excel Data Analysis and Business Modeling», Wayne Winston

Для кого. Для тех, кто изучает бизнес-аналитику, и знает английский на уровне Upper-Intermediate и выше.

О чем. Книга о функциях Excel для бизнеса и сложных вопросах бизнес-аналитики. С тематическими исследованиями финансовой составляющей бизнеса, реальными примерами.

Польза. Учит работать со сложными функциями Excel: сводными таблицами, описательной статистикой, Offset, Indirect, Excel Solver и макросами для автоматизации повторяющихся задач в анализе данных.

«AI and Analytics: Accelerating Business Decisions», Sameer Dhanrajani

Для кого. Для руководителей и начинающих предпринимателей в области ИИ и Data Science

О чем. Автор рассказывает о комплексных стратегиях и методологии в аналитике. Охватывает большинство популярных отраслей бизнеса — страхование, розничную. торговлю, банковское дело.

Польза. Помогает понять основы бизнес-аналитики. Предлагает бизнес-идеи развития компаний с использованием блокчейна, криптовалют, чат-ботов и других популярных технологий.

«Doing Data Science», Кэти О’Нил, Рэйчел Шатт

Для кого. Для новичков, которые уже освоили базовые понятия DS, и переходят к изучению технической литературы.

О чем. Издание посвящено углубленному изучению фильтрации спама, регрессионных моделей, рекомендательных машин, введению в Big Data.

Польза. Помогает систематизировать знания об основах Data Science.

«Data Science at the Command Line», Жерон Янссенс

Для кого. Для тех, кто изучает основы программирования и интересуется анализом данных.

О чем. Книга содержит информацию об анализе данных и командной строки.

Польза. Расширит ваши возможности в области анализа данных. Ознакомит с основами программирования и поможет проще получать, преобразовывать и анализировать данные.

«Python for Data Analysis» , Уэс МакКинни

Для кого. Для тех, кто хочет изучить Python — основной язык программирования в сфере анализа данных.

О чем. Книга на 400 страниц со всеми подробностями о языке программирования, которые пригодятся будущим специалистам по Data Science.

Польза. Поможет изучить язык программирования с нуля или начального уровня, научит применять его в анализе данных.

«Python Machine Learning», Sebastian Raschka

Для кого. Для тех, кто хочет глубже изучить техническую сторону работы с предсказательной аналитикой в языке программирования. Для инженеров с любым уровнем знаний в сфере машинного обучения.

О чем. Книга о возможностях Python в аналитических моделях, улучшении веб-приложений, открытии скрытых паттернов и структуры в данных с помощью кластеризации.

Польза. Научит применять регрессионный анализ, эффективно проводить предварительную обработку данных, применять анализ социальных сетей в определении настроений аудитории.

«Storytelling with Data: A Data Visualization Guide for Business Professionals», Cole Nussbaumer Knaflic

Для кого. Для тех, кто уже умеет проводить анализ данных и учится визуализировать результаты.

О чем. Книга об эстетическом представлении результатов анализа данных, понимании аудитории, подборе оптимального способа подачи информации. Содержит реальные примеры визуализации и их разбор.

Польза. Научит основам визуализации данных и наглядно покажет, как применять процесс в создании презентаций.

«Hadoop for Dummies», Dirk Deroos, Paul C. Zikopoulos, Roman B. Melnyk

Для кого. Для тех, кто начинает знакомство с Hadoop.

О чем. Книга содержит описание экосистемы Hadoop 2 и Yarn, примеры их реального использования, подробную инструкцию по установке кластера. Предоставляет детальную информацию о работе с SQL и Hive, развертывании Hadoop в облаке.

Польза. Научит работать с кластерами, шаблонами проектирования и экосистемой Hadoop на начальном уровне.

«Hadoop: The Definitive Guide», Tom White

Для кого. Для тех, кто хочет научиться использовать набор инструментов Hadoop на практике.

О чем. Сборник тематических исследований, как Hadoop решает конкретные задачи. Автор приводит детальный анализ каждого исследования и объясняет, как использовать инструменты в аналогичных ситуациях.

Польза. Научит использовать Hadoop Distributed File System для хранения больших массивов данных, создавать и настраивать кластеры Hadoop. Расскажет о возможностях MapReduce и распространенных ошибках в работе с моделью.

Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Аналитика – наука о проблемах бизнеса. Люди, решающие данные задачи, обладают системным видением. Популярность книг по данной тематике ежегодно возрастает, поэтому иногда трудно подобрать нужную литературу, которая доступно и просто сможет дать исчерпывающие ответы, волнующие бизнесменов. Вниманию представляется десятка лучших книг по бизнес-анализу для различного уровня подготовки человека.

Как выбрать книгу для аналитика

Каждый аналитик, начинающий или профессионал в своём деле, должен владеть основной базой – различными аналитическими методами. На деле он должен свободно владеть:

  • Статистическими методами – сбор информации, её систематизация и анализ, а также умение интерпретировать и оглашать данные;
  • Интеллектуальными методами – применение специальных вычислительных алгоритмов или статистических методик, автоматизировано выявленных в ранее неизвестных зависимостях в больших массивах данных – Data mining;
  • Техникой Text mining – выявление неизвестных зависимостей (тенденций) в тексте;
  • Способами оптимизации – нахождение оптимальных решений на базе заданных критериев и установленных ограничений;
  • Экспериментальным процессом – формировать тестовые и контрольные группы методом случайного отбора; выявлять причины и степень влияния независимых переменных на зависимый показатель.

На что обратить внимание при покупке аналитической книги? Существует несколько основных пунктов для определения:

  1. Сфера деятельности. Все книги по аналитике делятся, в основном, на две крупные ветви: касающиеся компьютерных программ и ведения бизнеса.
  2. Уровень сложности. Любое пособие рассчитано на определённый круг пользователей: с начальным уровнем подготовки, средним, высоким и профессиональным.
  3. Выбор издательства и автора. Достаточно прочесть аннотацию книги и бегло изучить биографию автора. Чтобы не совершить ошибки при выборе литературы, можно изучить содержание пособия или проанализировать отзывы читателей.
  4. Удобство использования. Книга может быть в электронном виде, что позволяет штудировать её в любом месте, например в транспорте. Компактные книги можно брать в путешествие.
  5. Стоимость. Популярные книги стоят прилично, однако бывают интернет-версии, которые предлагаются компанией прочесть пособие в онлайн режиме с определённой платформы бесплатно.
Читать еще:  Скачать книги по data science

Большинство начинающих бизнесменов не знают, с чего начать. В учебных учреждениях даётся обязательный список книг, которые нужно прочитать, чтобы иметь общее представление об аналитике. Самоучкам можно изучить рекомендуемые пособия от самостоятельных, успешно реализовавших себя в бизнесе аналитиков.

Рейтинг качественных книг для аналитиков

Представленная линейка книг подобрана для поклонников различного жанра аналитического изложения материала. В обзор вошли пособия, которые являются лучшими на нынешний год, подходящие для людей различных социальных сфер. Каждая модель учебника сопровождается кратким описанием, положительными и отрицательными характеристиками, а также индивидуальными сведениями с приблизительной стоимостью. Предоставленные информационные сведения являются одними из главных критериев выбора того или иного пособия.

Кому: руководителям, менеджерам, аналитикам, а также подойдёт для начинающего специалиста.

Кем написана: директором по аналитике в компании «Warby Parker».

О чём: разъяснение вопросов, что для компании означает управление на основе данных, и как к нему прийти.

Книжка переведена на русский язык. Она оснащена поучительным материалом от сбора данных и наглядных отчетов до анализа и обоснованных решений. Написанная рукопись основывается на проведённых автором интервью с аналитиками и учёными, а также в ней собраны кейсы.

Обложка книги «Аналитическая культура»

Книга с иллюстрациями – своего рода практикум, который даёт общее представление о процессах, проводимых компаниями для их процветания. Автор рассказывает о процессах, которые необходимо ввести на всех уровнях с подробным описанием, как это сделать. Он затрагивает основные проблемы, возникающие в этом процессе, и даёт исчерпывающие ответы для их решения.

Какие книги стоит почитать аналитику? Книги по анализу данных.

Thinking, Fast and Slow, Daniel Kahneman («Думай медленно… решай быстро»)
Financial Times в своем обзоре назвала эту книгу шедевром. Автор, Даниэль Канеман, лауреат Нобелевской премии по экономике, рассказывает как мы совершаем ошибки, хотя нам кажется, что принимаемое нами решение абсолютно верное. Книга стала бестселлером, переведена на многие языки, в том числе на русский:
https://www.ozon.ru/context/detail/id/24286114/

Customer and Business Analytics, Daniel S. Putler («Клиенты и бизнес-аналитика«)
Эта книга — для владельцев малого и среднего бизнеса. Издание рассказывает, как Data Mining помогает принимать управленческие решения и увеличивает эффективность работы компаний:
https://www.amazon.co.uk/Customer-Business-Analytics-Applied-Decision/dp/1466503963

Show Me the Numbers, Stephen Few («Покажите мне цифры»)
Книга для общего знакомства с анализом информации: как правильно складывать столбцы и записывать строки,как сформировать из отчетов и данных схемы и диаграммы, которые сделают работу прозрачнее и расскажут, что ждет бизнес в будущем. Незаменимое издание для новичков бизнес-аналитики:
https://www.amazon.co.uk/SHOW-ME-NUMBERS-STEPHEN-FEW/dp/0970601972/ref=la_B001H6IQ5M_1_1?s=books&ie=UTF8&qid=1454603902&sr=1-1

Now You See It, Stephen Few («Теперь вы видите это»)
Эту книгу можно назвать продолжением «Покажите мне цифры». Издание рассказывает о принципах количественного анализа данных и содержит много графиков и практических примеров:
https://www.amazon.co.uk/Now-You-See-Stephen-Few/dp/0970601980/ref=asap_bc?ie=UTF8

The Visual Display of Quantitative Information, Edward Tufte («Визуальное отображение количественной информации»)
Второе издание классического пособия по изучению визуального отображения данных. В книге 250 графических примеров, которые наглядно рассказывают обо всех возможных видах графиков, правилах их состояния и частых ошибках:
https://www.edwardtufte.com/tufte/books_vdqi

Signal, Stephen Few («Сигнал»)
Чем больше бизнес, тем больше данных поступают в офис компании. Со временем информации может стать так много, что руководители и аналитики могут не заметить важную или даже тревожную информацию. Эта книга рассказывает, как не «оглохнуть» в информационном шуме и научиться видеть действительно важные данные:
https://www.amazon.co.uk/gp/product/1938377052?keywords=signal%20stephen%20few&qid=1454621970&ref_=sr_1_1&s=books&sr=1-1

Statistics Done Wrong, Alex Reinhart («Неправильная статистика»)
Работая с большим количеством хранилищ данных любой пользователь, от начинающего маркетолога до опытного аналитика или директора компании, может допустить ошибку. Одну, может быть, самую незначительную. Но тогда возникает риск того, что все отчеты и принятые на их основании решения неверны. Избежать этого поможет полное руководство Алекса Рейнхарта по самым распространенным статистическим ошибкам. Книга распространяется бесплатно, скачать ее можно по ссылке:
https://www.statisticsdonewrong.com/index.html

The Functional Art, Alberto Cairo («Функциональное искусство»)
Если вдуматься, нас окружает огромное количество данных, компании могут собирать информацию буквально отовсюду. «Функциональное искусство» — книга о магии цифр. Альберто Каир рассказывает, как данные могут указывать на слабые и сильные стороны в работе бизнесменов, ученых и политиков. Книга выпущена вместе с диском, содержащим видеоуроки:
https://www.amazon.com/gp/product/0321834739/

The Truthful Art , Alberto Cairo («Истинное искусство»)
Еще одна книга автора Альберто Каиро рассказывает про невероятные возможности инфорграфики. Возможности, которые мы упускаем. Речь в книге идет не только о бизнесе, но и любых других составляющих нашей жизни. Цифры окружают людей повсюду и преобразование этой информации в инофграфику дает возможность увидеть скрытое:
https://www.amazon.com/gp/product/0321934075

Назад к Базе знаний

Tableau — это мощная система интерактивной аналитики, с помощью которой глубокий анализ больших данных делается быстро и наглядно. Tableau не требует дорогостоящего внедрения.

Предпосылки к изучению data science начались с курсов статистики и эконометрики. Предлагаю вашему вниманию книги по data science , с которыми я в той или иной степени ознакомился и которые помогают понять как исследовать данные, для чего это нужно и как это использовать в бизнесе (содержания многих книг пересекаются, но интересны, по-своему, своими примерами и манерой изложения). Для удобства список разбит на несколько разделов (по направлению), но в главном разделе источники могут пересекаться (проранжированно в произвольном порядке). Некоторые книги изданы на русском и английском. Все книги доступны на Амазоне (англ.), на Озоне и в Лабиринте (русск.). И да, стоят они недёшево (хотя некоторые из них доступны бесплатно, смотрите снизу источники из LeanPub). Самые интересные я себе покупал, но большинство из них брал в библиотеке университетов, в которых учился или с которыми сотрудничаю.

I. Литература по data science (наука о данных)

1. Data Science for Business. Foster Provost, Tom Fawcett.
2. Doing Data Science. Rachel Schutt, Cathy O’Neil.
3. Agile Data Science. Russell Jurney.
4. Applied Data Science. Ian Langmore, Daniel Krasner.
5. О чем говорят цифры. Как понимать и использовать данные. Томас Дэвенпорт, Ким Хо.
Keeping Up With The Quants: Your Guide to Understanding and Using Analytics. Thomas H. Davenport, Jinho Kim.
6. Аналитика как конкурентное преимущество. Том Дэвенпорт и Джон Харрис.
7. Sexy Little Numbers: How to Grow Your Business Using the Data You Already Have. Maex Dimitri, Paul B. Brown.
Ключевые цифры: Как заработать больше, используя данные, которые у вас уже есть. Димитри Маекс, Пол Браун
8. Data Smart: Using Data Science to Transform Information into Insight. John W. Foreman.
Много цифр: Анализ больших данных при помощи Excel. Джон Форман.
9. Data Analysis with Open Source Tools. Philipp K. Janert.
10. Data Scientists at Work. Sebastian Gutierrez.
11. Data Science For Dummies. Lillian Pierson.
12. Data Science at the Command Line. Jeroen Janssens.
13. Data Science from Scratch. Joel Grus.
14. Learning to Love Data Science: Explorations of Emerging Technologies and Platforms for Predictive Analytics, Machine Learning, Digital Manufacturing, and Supply Chain Optimization. Mike Barlow.
15. Data Science in R: A Case Studies Approach to Computational Reasoning and Problem Solving. Deborah Nolan, Duncan Temple Lang.
16. Parallel Computing for Data Science with Examples in R, C++ and CUDA. Norman Matloff.
17. Practical Data Science with R. Nina Zumel, John Mount.
18. Introducing Data Science: Big Data, Machine Learning, and more, using Python Tools. Davy Cielen, Arno D.B. Meysman, Mohamed Ali.
19. Practical Data Science Cookbook: 89 hands-on recipes to help you complete real-world data science projects in R and Python. Tony Ojeda, Sean Patrick Murphy, Benjamin Bengfort, Abhijit Dasgupta.
20. Data Analytics: Models and Algorithms for Intelligent Data Analysis. Thomas A. Runkler.
21. Clean Data: Save time by discovering effortless strategies for cleaning, organizing, and manipulating your data. Megan Squire.

Читать еще:  Книги по андроиду

II. Книги по Big Data (большие данные)

1. Big data at work: dispelling the myths, uncovering the opportunities. Thomas H. Davenport.
2. Real-Time Big Data Analytics: Emerging Architecture. Mike Barlow.
3. Big Data Analytics with Spark. Mohammed Guller.
4. Big Data Glossary. Pete Warden.
5. Big Data For Dummies. Judith Hurwitz, Alan Nugent, Dr. Fern Halper, and Marcia Kaufman.
6. Big Data: A Revolution That Will Transform How We Live, Work, and Think. Viktor Mayer-Schönberger, Kenneth Cukier.
Большие данные: Революция, которая изменит то, как мы живем, работаем и мыслим. Виктор Майер-Шенбергер и Кеннет Кукьер.
7. Taming the Big Data Tidal Wave: Finding Opportunities in Huge Data Streams with Advanced Analytics. Bill Franks.
Укрощение больших данных: Как извлекать знания из массивов информации с помощью глубокой аналитики. Билл Фрэнкс.
8. Big Data Analytics: From Strategic Planning to Enterprise Integration with Tools, Techniques, NoSQL, and Graph. David Loshin.
9. The Analytics Revolution: How to Improve Your Business By Making Analytics Operational In The Big Data Era. Bill Franks.
Революция в аналитике: Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики. Билл Френкс.
10. Getting a Big Data Job For Dummies. Jason Williamson.
11. Hadoop For Dummies. Robert D. Schneider.
12. Hadoop: The Definitive Guide. Tom White.
Hadoop: Подробное руководство. Том Уайт.
13. Learning Spark: Lightning-Fast Big Data Analysis. Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia.
Изучаем Spark: молниеносный анализ данных. Карау Х., Конвински Э., Венде П., Захария М.
14. Advanced Analytics with Spark. Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills.
15. Big data: using smart big data, analytics and metrics to make better decisions and improve performance. Bernard Marr.
16. Big Data: Principles and Best Practices of Scalable Real-time Data Systems. Nathan Marz, James Warren.
17. Новые методы работы с большими данными: победные стратегии управления в бизнес- аналитике: Научно-практический сборник. Под редакцией доктора технических наук, профессора А. В. Шмида. — М.: ПАЛЬМИР, 2016.

III. Книги по Data Mining (дата майнинг, интеллектуальный анализ данных)

1. Data mining: practical machine learning tools and techniques. Ian H. Witten, Eibe Frank, Mark A. Hall.
2. A Practical Guide to Data Mining for Business and Industry. Andrea Ahlemeyer-Stubbe, Shirley Coleman.
3. Learning Data Mining with R: Develop key skills and techniques with R to create and customize data mining algorithms. Bater Makhabel.
4. Data Mining Algorithms: Explained Using R. Paweł Cichosz.
5. Data Mining and Business Analytics with R. Johannes Ledolter.
6. Data Mining For Dummies. Meta. S. Brown.
7. Data mining for business intelligence: concepts, techniques, and applications in Microsoft Office Excel with XLMiner. Galit Shmueli, Nitin R. Patel, Peter C. Bruce.
8. Data mining: concepts and techniques. Jiawei Han, Micheline Kamber, Jian Pei.
9. Programming Collective Intelligence. Toby Segaran.
Программируем коллективный разум. Тоби Сегаран.
10. Data mining with R: learning with case studies. Luis Torgo.
11. Mining the Social Web. Matthew A. Russell.
12. Commercial data mining: processing, analysis and modeling for predictive analytics projects. David Nettleton.
13. R and Data Mining: Examples and Case Studies. Yanchang Zhao.
14. Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery. Graham Williams.
15. Data Mining. Чубукова И.А.
16. Бизнес-аналитика: от данных к знаниям. Паклин Н.Б., Орешков В.И.
17. Mastering Social Media Mining with R: Extract valuable data from social media sites and make better business decisions using R. Sharan Kumar Ravindran, Vikram Garg.
18. Social Media Mining with R: Deploy cutting-edge sentiment analysis techniques to real-world social media data using R. Nathan Danneman, Richard Heimann.
19. Mining of Massive Datasets. Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman.

IV. Книги по Machine Learning (машинное обучение)

1. Machine Learning: the Art and Science of Algorithms that Make Sense of Data. Peter Flach.
Машинное обучение: наука и искусство построения алгоритмов, которые извлекают знания из данных. Петер Флах.
2. Building Machine Learning Systems with Python. Luis Pedro Coelho, Willi Richert.
Построение систем машинного обучения на языке Python. Луис Педро Коэльо, Вилли Ричарт.
3. Machine Learning with Spark: Create scalable machine learning applications to power a modern data-driven business using Spark. Nick Pentreath.

V. Книги по R

1. Getting Started with RStudio. John Verzani.
2. Learning Predictive Analytics with R: Get to grips with key data visualization and predictive analytic skills using R. Eric Mayor.
3. Mastering Data Analysis with R: Gain clear insights into your data and solve real-world data science problems with R – from data munging to modeling and visualization. Gergely Daróczi.
4. Parallel R. Q. Ethan McCallum and Stephen Weston.
5. R in Action: Data analysis and graphics with R. Robert I. Kabacoff.

VI. Книги по Python

1. Python for Data Analysis. Wes McKinney.
Python и анализ данных. Уэс Маккинли.
2. Python Data Analysis: Learn how to apply powerful data analysis techniques with popular open source Python modules. Ivan Idris.
3. Python Machine Learning: Unlock deeper insights into machine learning with this vital guide to cutting-edge predictive analytics. Sebastian Raschka.
4. Python in Practice: Create Better Programs Using Concurrency, Libraries, and Patterns. Mark Summerfield.
Python на практике: создание качественных программ с использованием параллелизма, библиотек и паттернов. Марк Саммерфилд.

Читать еще:  Книга чарли хуперта искусство харизмы

VII. Книги по Business Intelligence и Visualization (визуализация)

1. Business intelligence and the cloud: strategic implementation guide. Michael S. Gendron.
2. Oracle Business Intelligence: The Condensed Guide to Analysis and Reporting. Yuli Vasiliev.
3. Visual Intelligence: Microsoft Tools and Techniques for Visualizing Data. Mark Stacey, Joe Salvatore, Adam Jorgensen.
4. Communicating Data with Tableau. Ben Jones.
5. Creating Data Stories with Tableau Public: Illustrate your data in a more interactive and interesting way using Tableau Public. Ashley Ohmann, Matt Floyd.
6. Data Visualization For Dummies. Mico Yuk, Stephanie Diamond.
7. Graph Analysis and Visualization: Discovering Business Opportunity in Linked Data. Richard Brath, David Jonker.
8. Interactive Data Visualization for the Web. Scott Murray.
9. Learning QlikView Data Visualization: Visualize and analyze data with the most intuitive business intelligence tool, QlikView. Karl Pover.
10. Python Data Visualization Cookbook: Over 60 recipes that will enable you to learn how to create attractive visualizations using Python’s most popular libraries. Igor Milovanović.
11. SAS Programming and Data Visualization Techniques: A Power User’s Guide. Philip R. Holland.
12. Tableau Dashboard Cookbook: Over 40 recipes on designing professional dashboards by implementing data visualization principles. Jen Stirrup.
13. Visualizing Data. Ben Fry.
14. Storytelling with Data: A Data Visualization Guide for Business Professionals. Cole Nussbaumer Knaflic

VIII. Книги по базам данных и Data Warehousing

1. Database systems: a practical approach to design, implementation, and management. Connolly, Thomas M., Carolyn E. Begg.
2. Beginning Database Design Solutions. Rod Stephens.
3. Build Your Own Database Driven Web Site Using PHP & MySQL. Kevin Yank.
4. Databases for Small Business: Essentials of Database Management, Data Analysis, and Staff Training for Entrepreneurs and Professionals. Anna Manning.
5. Databases: A Beginner’s Guide. Andrew J. Oppel.
6. Building a Data Warehouse: With Examples in SQL Server. Vincent Rainardi.
7. The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. Ralph Kimball, Margy Ross.
8. NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence. Pramod J. Sadalage, Martin Fowler.
NoSQL: новая методология разработки нереляционных баз данных. Прамодкумар Дж. Садаладж, Мартин Фаулер.
9. Understanding SQL. Martin Gruber.
SQL для простых смертных. Мартин Грабер.

IX. Книги по Information Retrieval (информационный поиск)

1. Web Information Retrieval. Stefano Ceri, Alessandro Bozzon, Marco Brambilla, Emanuele Della Valle, Piero Fraternali, Silvia Quarteroni.
2. Search Patterns. Peter Morville, Jeffery Callender.
3. An Introduction to Information Retrieval. Christopher D. Manning, Prabhakar Raghavan, Hinrich Schutze.
Введение в информационный поиск. Кристофер Д. Меннинг, Прабакар Рагаван, Генрих Шетзе.

X. Бесплатные книги по data science из LeanPub (узнал про них из курсов data science на Coursera)

1. The Art of Data Science. A Guide for Anyone Who Works with Data. Roger D. Peng, Elizabeth Matsui.
2. The Elements of Data Analytic Style. A guide for people who want to analyze data. Jeff Leek.
3. Developing Data Products in R. Brian Caffo.
4. Executive Data Science. A Guide to Training and Managing the Best Data Scientists. Brian Caffo, Roger D. Peng, Jeffrey Leek.
5. Exploratory Data Analysis with R. Roger D. Peng.
6. The Hitchhiker’s Guide to Ggplot2 in R. Jodie Burchell, Mauricio Vargas.
7. Statistical inference for data science. A companion to the Coursera Statistical Inference Course. Brian Caffo.
8. Advanced linear models for data science. Brian Caffo.
9. How to be a modern scientist. Jeffrey Leek.
10. Regression Models for Data Science in R. A companion book for the Coursera Regression Models class. Brian Caffo.
11. Report Writing for Data Science in R. Roger D. Peng.
12. R Programming for Data Science. Roger D. Peng.

Анализ данных книги

Роль методов анализа данных в нашей жизни весьма значительна. Люди, часто не задумываясь и не осознавая, постоянно их используют в повседневной практике. Анализ данных пронизывает все аспекты современной жизни, служит основой для многих решений в предпринимательской и общественной деятельности, информируют о тенденциях и факторах, которые влияют на нашу жизнь. Анализ данных как научная дисциплина в системе прикладной статистики разрабатывает и систематизирует понятия, приемы, математические методы и модели, предназначенные для организации отбора из исследуемой совокупности подлежащих обследованию единиц, их стандартной записи, систематизации и обработке с целью их удобного представления и интерпретации, получения научных и практических выводов. В настоящем учебнике анализ данных рассматривается как дисциплина, основанная на статистических методах и вычислительных алгоритмах, позволяющих извлекать знания из результатов наблюдений.

Сборник включает статьи участников международной научно-практической конференции «Экономика и управление: проблемы и перспективы развития», прошедшей 15-16 ноября 2010 г. в г. Волгограде на базе Регионального центра социально-экономических и политических исследований «Общественное содействие». Статьи посвящены актуальным вопросам экономической, управленческой теории и практики, изучаемыми учеными из разных стран — участниц конференции.

Колоссальный рост объема разнообразной информации в современном обществе (30% в год), называемый информационным взрывом, настоятельно требует, как новых решений в области анализа данных, так и новых, высококвалифицированных кадров в этой области. Спрос на таких специалистов растет экспоненциально. При этом особенно остро недостаток таких специалистов наблюдается в междисциплинарных областях, таких, как экономика и финансы. Крупнейшие финансовые компании и банки (Сбербанк, ВТБ, Тиньков-банк) постепенно перемещаются в область анализа данных и IT-технологий, становясь сильными игроками и в этих, еще недавно совсем новых для них областях. Помимо этих компаний, большой спрос на высококвалифицированных специалистов наблюдается и в разного рода хедж-фондах (Synthesys, Quantstellation, datafork, Worldquant ltd и др.). Таким компаниям требуются специалисты, которые наряду с программистскими навыками владеют основами финансовых технологий и анализа данных в финансах. Острая потребность кадров в таких областях наблюдается не только в России — это общемировая тенденция. В ответ на эту потребность практически во всех современных зарубежных университетах либо открыты, либо открываются программы на стыке анализа данных и финансовых технологий. В этой связи представляется актуальной открытие новых образовательных программ в области анализа данных в финансах. В данном докладе анализируются особенности построения такого рода программ, способы интеграции лекционных и практических курсов в области информационных технологий, экономики и финансов, варианты интернационализации таких программ, методы привлечения ведущих иностранных и корпоративных партнеров.

Ссылка на основную публикацию
Adblock
detector