Скачать книги по data science
12 книг по Data Science для новичков и продвинутых
Редактор блога Нетологии Юлия Чернова сделала подборку книг о Data Science на английском языке, которые помогут новичкам разобраться в основах, а продвинутым — прокачать знания и навыки.
«Numsense! Data Science for the Layman», Annalyn Ng, Kenneth Soo
Для кого. Для новичков в сфере Data Science, которые знают английский.
О чем. Автор описывает регрессивный анализ, нейронные сети А/В тесты, деревья решений и другие базовые понятия.
Польза. Поможет вникнуть в основы DS без математической сложности, разобраться в теме при помощи наглядных иллюстраций.
«Machine Learning», Tom Mitchell
Для кого. Для новичков, которые не знают ничего об искусственном интеллекте и статистике. Для владеющих английским на продвинутом уровне.
О чем. Описания популярных алгоритмов — байесовского обучения, обучения с подкреплением, нейронных сетей с подробными примерами.
Польза. Лучший вводный материал для тех кто изучает элементарные понятия машинного обучения. Поможет разобраться в теме и понять основы перед дальнейшим углубленным изучением.
«Blockchain Basics: A Non-Technical Introduction in 25 Steps», Daniel Drescher
Для кого. Для новичков, которые не хотят разбираться с терминами из программирования и знают английский.
О чем. Книга о технологии блокчейн на примерах криптовалют Bitcoin, Ethereum и Litecoin.
Польза. Доступно объясняет, что такое блокчейн, без сложных технических терминов, с примерами и иллюстрациями.
«Microsoft Excel Data Analysis and Business Modeling», Wayne Winston
Для кого. Для тех, кто изучает бизнес-аналитику, и знает английский на уровне Upper-Intermediate и выше.
О чем. Книга о функциях Excel для бизнеса и сложных вопросах бизнес-аналитики. С тематическими исследованиями финансовой составляющей бизнеса, реальными примерами.
Польза. Учит работать со сложными функциями Excel: сводными таблицами, описательной статистикой, Offset, Indirect, Excel Solver и макросами для автоматизации повторяющихся задач в анализе данных.
«AI and Analytics: Accelerating Business Decisions», Sameer Dhanrajani
Для кого. Для руководителей и начинающих предпринимателей в области ИИ и Data Science
О чем. Автор рассказывает о комплексных стратегиях и методологии в аналитике. Охватывает большинство популярных отраслей бизнеса — страхование, розничную. торговлю, банковское дело.
Польза. Помогает понять основы бизнес-аналитики. Предлагает бизнес-идеи развития компаний с использованием блокчейна, криптовалют, чат-ботов и других популярных технологий.
«Doing Data Science», Кэти О’Нил, Рэйчел Шатт
Для кого. Для новичков, которые уже освоили базовые понятия DS, и переходят к изучению технической литературы.
О чем. Издание посвящено углубленному изучению фильтрации спама, регрессионных моделей, рекомендательных машин, введению в Big Data.
Польза. Помогает систематизировать знания об основах Data Science.
«Data Science at the Command Line», Жерон Янссенс
Для кого. Для тех, кто изучает основы программирования и интересуется анализом данных.
О чем. Книга содержит информацию об анализе данных и командной строки.
Польза. Расширит ваши возможности в области анализа данных. Ознакомит с основами программирования и поможет проще получать, преобразовывать и анализировать данные.
«Python for Data Analysis» , Уэс МакКинни
Для кого. Для тех, кто хочет изучить Python — основной язык программирования в сфере анализа данных.
О чем. Книга на 400 страниц со всеми подробностями о языке программирования, которые пригодятся будущим специалистам по Data Science.
Польза. Поможет изучить язык программирования с нуля или начального уровня, научит применять его в анализе данных.
«Python Machine Learning», Sebastian Raschka
Для кого. Для тех, кто хочет глубже изучить техническую сторону работы с предсказательной аналитикой в языке программирования. Для инженеров с любым уровнем знаний в сфере машинного обучения.
О чем. Книга о возможностях Python в аналитических моделях, улучшении веб-приложений, открытии скрытых паттернов и структуры в данных с помощью кластеризации.
Польза. Научит применять регрессионный анализ, эффективно проводить предварительную обработку данных, применять анализ социальных сетей в определении настроений аудитории.
«Storytelling with Data: A Data Visualization Guide for Business Professionals», Cole Nussbaumer Knaflic
Для кого. Для тех, кто уже умеет проводить анализ данных и учится визуализировать результаты.
О чем. Книга об эстетическом представлении результатов анализа данных, понимании аудитории, подборе оптимального способа подачи информации. Содержит реальные примеры визуализации и их разбор.
Польза. Научит основам визуализации данных и наглядно покажет, как применять процесс в создании презентаций.
«Hadoop for Dummies», Dirk Deroos, Paul C. Zikopoulos, Roman B. Melnyk
Для кого. Для тех, кто начинает знакомство с Hadoop.
О чем. Книга содержит описание экосистемы Hadoop 2 и Yarn, примеры их реального использования, подробную инструкцию по установке кластера. Предоставляет детальную информацию о работе с SQL и Hive, развертывании Hadoop в облаке.
Польза. Научит работать с кластерами, шаблонами проектирования и экосистемой Hadoop на начальном уровне.
«Hadoop: The Definitive Guide», Tom White
Для кого. Для тех, кто хочет научиться использовать набор инструментов Hadoop на практике.
О чем. Сборник тематических исследований, как Hadoop решает конкретные задачи. Автор приводит детальный анализ каждого исследования и объясняет, как использовать инструменты в аналогичных ситуациях.
Польза. Научит использовать Hadoop Distributed File System для хранения больших массивов данных, создавать и настраивать кластеры Hadoop. Расскажет о возможностях MapReduce и распространенных ошибках в работе с моделью.
Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.
Предпосылки к изучению data science начались с курсов статистики и эконометрики. Предлагаю вашему вниманию книги по data science , с которыми я в той или иной степени ознакомился и которые помогают понять как исследовать данные, для чего это нужно и как это использовать в бизнесе (содержания многих книг пересекаются, но интересны, по-своему, своими примерами и манерой изложения). Для удобства список разбит на несколько разделов (по направлению), но в главном разделе источники могут пересекаться (проранжированно в произвольном порядке). Некоторые книги изданы на русском и английском. Все книги доступны на Амазоне (англ.), на Озоне и в Лабиринте (русск.). И да, стоят они недёшево (хотя некоторые из них доступны бесплатно, смотрите снизу источники из LeanPub). Самые интересные я себе покупал, но большинство из них брал в библиотеке университетов, в которых учился или с которыми сотрудничаю.
I. Литература по data science (наука о данных)
1. Data Science for Business. Foster Provost, Tom Fawcett.
2. Doing Data Science. Rachel Schutt, Cathy O’Neil.
3. Agile Data Science. Russell Jurney.
4. Applied Data Science. Ian Langmore, Daniel Krasner.
5. О чем говорят цифры. Как понимать и использовать данные. Томас Дэвенпорт, Ким Хо.
Keeping Up With The Quants: Your Guide to Understanding and Using Analytics. Thomas H. Davenport, Jinho Kim.
6. Аналитика как конкурентное преимущество. Том Дэвенпорт и Джон Харрис.
7. Sexy Little Numbers: How to Grow Your Business Using the Data You Already Have. Maex Dimitri, Paul B. Brown.
Ключевые цифры: Как заработать больше, используя данные, которые у вас уже есть. Димитри Маекс, Пол Браун
8. Data Smart: Using Data Science to Transform Information into Insight. John W. Foreman.
Много цифр: Анализ больших данных при помощи Excel. Джон Форман.
9. Data Analysis with Open Source Tools. Philipp K. Janert.
10. Data Scientists at Work. Sebastian Gutierrez.
11. Data Science For Dummies. Lillian Pierson.
12. Data Science at the Command Line. Jeroen Janssens.
13. Data Science from Scratch. Joel Grus.
14. Learning to Love Data Science: Explorations of Emerging Technologies and Platforms for Predictive Analytics, Machine Learning, Digital Manufacturing, and Supply Chain Optimization. Mike Barlow.
15. Data Science in R: A Case Studies Approach to Computational Reasoning and Problem Solving. Deborah Nolan, Duncan Temple Lang.
16. Parallel Computing for Data Science with Examples in R, C++ and CUDA. Norman Matloff.
17. Practical Data Science with R. Nina Zumel, John Mount.
18. Introducing Data Science: Big Data, Machine Learning, and more, using Python Tools. Davy Cielen, Arno D.B. Meysman, Mohamed Ali.
19. Practical Data Science Cookbook: 89 hands-on recipes to help you complete real-world data science projects in R and Python. Tony Ojeda, Sean Patrick Murphy, Benjamin Bengfort, Abhijit Dasgupta.
20. Data Analytics: Models and Algorithms for Intelligent Data Analysis. Thomas A. Runkler.
21. Clean Data: Save time by discovering effortless strategies for cleaning, organizing, and manipulating your data. Megan Squire.
II. Книги по Big Data (большие данные)
1. Big data at work: dispelling the myths, uncovering the opportunities. Thomas H. Davenport.
2. Real-Time Big Data Analytics: Emerging Architecture. Mike Barlow.
3. Big Data Analytics with Spark. Mohammed Guller.
4. Big Data Glossary. Pete Warden.
5. Big Data For Dummies. Judith Hurwitz, Alan Nugent, Dr. Fern Halper, and Marcia Kaufman.
6. Big Data: A Revolution That Will Transform How We Live, Work, and Think. Viktor Mayer-Schönberger, Kenneth Cukier.
Большие данные: Революция, которая изменит то, как мы живем, работаем и мыслим. Виктор Майер-Шенбергер и Кеннет Кукьер.
7. Taming the Big Data Tidal Wave: Finding Opportunities in Huge Data Streams with Advanced Analytics. Bill Franks.
Укрощение больших данных: Как извлекать знания из массивов информации с помощью глубокой аналитики. Билл Фрэнкс.
8. Big Data Analytics: From Strategic Planning to Enterprise Integration with Tools, Techniques, NoSQL, and Graph. David Loshin.
9. The Analytics Revolution: How to Improve Your Business By Making Analytics Operational In The Big Data Era. Bill Franks.
Революция в аналитике: Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики. Билл Френкс.
10. Getting a Big Data Job For Dummies. Jason Williamson.
11. Hadoop For Dummies. Robert D. Schneider.
12. Hadoop: The Definitive Guide. Tom White.
Hadoop: Подробное руководство. Том Уайт.
13. Learning Spark: Lightning-Fast Big Data Analysis. Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia.
Изучаем Spark: молниеносный анализ данных. Карау Х., Конвински Э., Венде П., Захария М.
14. Advanced Analytics with Spark. Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills.
15. Big data: using smart big data, analytics and metrics to make better decisions and improve performance. Bernard Marr.
16. Big Data: Principles and Best Practices of Scalable Real-time Data Systems. Nathan Marz, James Warren.
17. Новые методы работы с большими данными: победные стратегии управления в бизнес- аналитике: Научно-практический сборник. Под редакцией доктора технических наук, профессора А. В. Шмида. — М.: ПАЛЬМИР, 2016.
III. Книги по Data Mining (дата майнинг, интеллектуальный анализ данных)
1. Data mining: practical machine learning tools and techniques. Ian H. Witten, Eibe Frank, Mark A. Hall.
2. A Practical Guide to Data Mining for Business and Industry. Andrea Ahlemeyer-Stubbe, Shirley Coleman.
3. Learning Data Mining with R: Develop key skills and techniques with R to create and customize data mining algorithms. Bater Makhabel.
4. Data Mining Algorithms: Explained Using R. Paweł Cichosz.
5. Data Mining and Business Analytics with R. Johannes Ledolter.
6. Data Mining For Dummies. Meta. S. Brown.
7. Data mining for business intelligence: concepts, techniques, and applications in Microsoft Office Excel with XLMiner. Galit Shmueli, Nitin R. Patel, Peter C. Bruce.
8. Data mining: concepts and techniques. Jiawei Han, Micheline Kamber, Jian Pei.
9. Programming Collective Intelligence. Toby Segaran.
Программируем коллективный разум. Тоби Сегаран.
10. Data mining with R: learning with case studies. Luis Torgo.
11. Mining the Social Web. Matthew A. Russell.
12. Commercial data mining: processing, analysis and modeling for predictive analytics projects. David Nettleton.
13. R and Data Mining: Examples and Case Studies. Yanchang Zhao.
14. Data Mining with Rattle and R: The Art of Excavating Data for Knowledge Discovery. Graham Williams.
15. Data Mining. Чубукова И.А.
16. Бизнес-аналитика: от данных к знаниям. Паклин Н.Б., Орешков В.И.
17. Mastering Social Media Mining with R: Extract valuable data from social media sites and make better business decisions using R. Sharan Kumar Ravindran, Vikram Garg.
18. Social Media Mining with R: Deploy cutting-edge sentiment analysis techniques to real-world social media data using R. Nathan Danneman, Richard Heimann.
19. Mining of Massive Datasets. Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman.
IV. Книги по Machine Learning (машинное обучение)
1. Machine Learning: the Art and Science of Algorithms that Make Sense of Data. Peter Flach.
Машинное обучение: наука и искусство построения алгоритмов, которые извлекают знания из данных. Петер Флах.
2. Building Machine Learning Systems with Python. Luis Pedro Coelho, Willi Richert.
Построение систем машинного обучения на языке Python. Луис Педро Коэльо, Вилли Ричарт.
3. Machine Learning with Spark: Create scalable machine learning applications to power a modern data-driven business using Spark. Nick Pentreath.
V. Книги по R
1. Getting Started with RStudio. John Verzani.
2. Learning Predictive Analytics with R: Get to grips with key data visualization and predictive analytic skills using R. Eric Mayor.
3. Mastering Data Analysis with R: Gain clear insights into your data and solve real-world data science problems with R – from data munging to modeling and visualization. Gergely Daróczi.
4. Parallel R. Q. Ethan McCallum and Stephen Weston.
5. R in Action: Data analysis and graphics with R. Robert I. Kabacoff.
VI. Книги по Python
1. Python for Data Analysis. Wes McKinney.
Python и анализ данных. Уэс Маккинли.
2. Python Data Analysis: Learn how to apply powerful data analysis techniques with popular open source Python modules. Ivan Idris.
3. Python Machine Learning: Unlock deeper insights into machine learning with this vital guide to cutting-edge predictive analytics. Sebastian Raschka.
4. Python in Practice: Create Better Programs Using Concurrency, Libraries, and Patterns. Mark Summerfield.
Python на практике: создание качественных программ с использованием параллелизма, библиотек и паттернов. Марк Саммерфилд.
VII. Книги по Business Intelligence и Visualization (визуализация)
1. Business intelligence and the cloud: strategic implementation guide. Michael S. Gendron.
2. Oracle Business Intelligence: The Condensed Guide to Analysis and Reporting. Yuli Vasiliev.
3. Visual Intelligence: Microsoft Tools and Techniques for Visualizing Data. Mark Stacey, Joe Salvatore, Adam Jorgensen.
4. Communicating Data with Tableau. Ben Jones.
5. Creating Data Stories with Tableau Public: Illustrate your data in a more interactive and interesting way using Tableau Public. Ashley Ohmann, Matt Floyd.
6. Data Visualization For Dummies. Mico Yuk, Stephanie Diamond.
7. Graph Analysis and Visualization: Discovering Business Opportunity in Linked Data. Richard Brath, David Jonker.
8. Interactive Data Visualization for the Web. Scott Murray.
9. Learning QlikView Data Visualization: Visualize and analyze data with the most intuitive business intelligence tool, QlikView. Karl Pover.
10. Python Data Visualization Cookbook: Over 60 recipes that will enable you to learn how to create attractive visualizations using Python’s most popular libraries. Igor Milovanović.
11. SAS Programming and Data Visualization Techniques: A Power User’s Guide. Philip R. Holland.
12. Tableau Dashboard Cookbook: Over 40 recipes on designing professional dashboards by implementing data visualization principles. Jen Stirrup.
13. Visualizing Data. Ben Fry.
14. Storytelling with Data: A Data Visualization Guide for Business Professionals. Cole Nussbaumer Knaflic
VIII. Книги по базам данных и Data Warehousing
1. Database systems: a practical approach to design, implementation, and management. Connolly, Thomas M., Carolyn E. Begg.
2. Beginning Database Design Solutions. Rod Stephens.
3. Build Your Own Database Driven Web Site Using PHP & MySQL. Kevin Yank.
4. Databases for Small Business: Essentials of Database Management, Data Analysis, and Staff Training for Entrepreneurs and Professionals. Anna Manning.
5. Databases: A Beginner’s Guide. Andrew J. Oppel.
6. Building a Data Warehouse: With Examples in SQL Server. Vincent Rainardi.
7. The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. Ralph Kimball, Margy Ross.
8. NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence. Pramod J. Sadalage, Martin Fowler.
NoSQL: новая методология разработки нереляционных баз данных. Прамодкумар Дж. Садаладж, Мартин Фаулер.
9. Understanding SQL. Martin Gruber.
SQL для простых смертных. Мартин Грабер.
IX. Книги по Information Retrieval (информационный поиск)
1. Web Information Retrieval. Stefano Ceri, Alessandro Bozzon, Marco Brambilla, Emanuele Della Valle, Piero Fraternali, Silvia Quarteroni.
2. Search Patterns. Peter Morville, Jeffery Callender.
3. An Introduction to Information Retrieval. Christopher D. Manning, Prabhakar Raghavan, Hinrich Schutze.
Введение в информационный поиск. Кристофер Д. Меннинг, Прабакар Рагаван, Генрих Шетзе.
X. Бесплатные книги по data science из LeanPub (узнал про них из курсов data science на Coursera)
1. The Art of Data Science. A Guide for Anyone Who Works with Data. Roger D. Peng, Elizabeth Matsui.
2. The Elements of Data Analytic Style. A guide for people who want to analyze data. Jeff Leek.
3. Developing Data Products in R. Brian Caffo.
4. Executive Data Science. A Guide to Training and Managing the Best Data Scientists. Brian Caffo, Roger D. Peng, Jeffrey Leek.
5. Exploratory Data Analysis with R. Roger D. Peng.
6. The Hitchhiker’s Guide to Ggplot2 in R. Jodie Burchell, Mauricio Vargas.
7. Statistical inference for data science. A companion to the Coursera Statistical Inference Course. Brian Caffo.
8. Advanced linear models for data science. Brian Caffo.
9. How to be a modern scientist. Jeffrey Leek.
10. Regression Models for Data Science in R. A companion book for the Coursera Regression Models class. Brian Caffo.
11. Report Writing for Data Science in R. Roger D. Peng.
12. R Programming for Data Science. Roger D. Peng.
10 книг по Data Science, рекомендуемых к прочтению в 2020 году
Data Science повсюду: заголовки новостей пестрят нейросетями и машинным обучением. Сайт proglib.io опубликовал подборку из 10 актуальных книг для освоения науки о данных. Представляем ее вашему вниманию.
1. Data Science
Автор — Джоэл Грас.
Автор изложил материал по Data Science в необходимом размере для скорейшего старта в профессии. Знания аналитики и дисциплины не потребуются. В процессе чтения вы будете изучать Python, алгебру, математический анализ и статистику, а также теорию вероятностей, машинное обучение и прочие темы. Дополнительный акцент сделан на методы анализа социальных сетей, основы баз данных и SQL.
2. Практическая статистика для специалистов Data Science
Авторы — Питер Брюс, Эндрю Брюс.
Для работы с изданием вам понадобятся знания математической статистики и языка R, а также базовые знания по общей теме. Легкодоступная форма подачи материала поможет быстро разобраться с такими темами, как: разведочный анализ данных, статистические эксперименты, проверка значимости, регрессия, классификация, машинное обучение и обучение без учителя.
3. Data Science
Авторы — Кэти О’Нил, Рэйчел Шатт.
Книга основана на курсе Колумбийского университета по анализу данных. В процессе обучения вы узнаете о байесовском методе, визуализации данных, статистических алгоритмах, рекомендательных движках, MapReduce и финансовом моделировании.
4. Теоретический минимум по Big Data
Авторы — Анналин Ын, Кеннет Су.
Издание не ориентировано только на профессионалов, заняться образованием могут начать аналитики, бизнесмены, программисты и непрофильные специалисты. На страницах этого труда рассматривается масса алгоритмов, каждому из которых посвящена отдельная глава, с картинками и примерами из реальных задач.
5. Основы Data Science и Big Data
Авторы — Дэви Силен, Арно Мейсман, Мохамед Али.
Изучение DS вы начнете с базовых вещей, а потом приступите к алгоритмам машинного обучения, массивам данных, NoSQL и т. д. В качестве языка программирования в этой книге используется Python со специальными библиотеками.
6. Python для сложных задач
Автор — Дж. Вандер Плас.
Данное руководство погрузит вас в самые популярные статистические методы обработки данных и научные исследования. В процессе прочтения вы сможете разобраться с тем, как считывать различные форматы данных, как их преобразовывать и визуализировать, а также строить статистические модели и применять машинное обучение.
7. Java Data Science Cookbook
Если вам необходимо построить научные модели для производства – Java ваше все. С помощью крутых библиотек, таких как MLlib, Weka и DL4j, вы сможете эффективно выполнить все необходимые задачи по обработке данных. Книга начинается с рецептов для получения, индексирования и поиска данных. Затем вы перейдете к различным методам анализа и извлечения информации. Последним учебным этапом будет обработка Big Data, глубокое обучение и визуализация.
8. Python Data Science Essentials
Автор — A. Boschetti.
Здесь вы найдете подробные примеры, которые помогут понять основные статистические методы сбора и анализа данных. Вы получите представление о передовых темах, таких как алгоритмы машинного обучения, распределенные вычисления, настройка моделей прогноза и обработка естественного языка. А еще вы познакомитесь с инструментами глубокого обучения, такими как XGBoost, LightGBM и CatBoost.
9. Jupyter for Data Science
Автор — D. Toomey.
Если вы знакомы с Jupyter Notebook и хотите узнать, как использовать его возможности для выполнения различных задач в Data Science, эта книга для вас. Данное издание разъяснит каждый шаг внедрения эффективного конвейера обработки данных с использованием Jupyter от исследования данных до визуализации. Вы научитесь использовать функции Jupyter, чтобы делиться своими идеями и кодом с коллегами. В книге также описано, как Python 3, R и Julia могут быть интегрированы в Jupyter для различных задач обработки данных.
10. Principles of Strategic Data Science
Автор — P. Prevos.
Книга начинается с объяснения того, что такое наука о данных и как организации могут ее использовать для оптимизации всех рабочих процессов. Затем автор приводит критерии надежности информационных продуктов и способы визуализации информации. В процессе изучения пятиэтапной структуры вы будете открывать для себя стратегические аспекты DS, которые позволяют повысить ценность извлекаемых данных. В заключительной главе рассматривается роль штатного аналитика данных в процессе интеграции DS-подхода в бизнес-процессы организации.
Топ-10 книг о Data Science для новичков
Несмотря на все обилие курсов, которые помогут вам изучить Data Science с нуля , не стоит забывать о пользе книг. С их помощью можно изучить не только основы, но и углубить свои знания в этой обширной, но крайне интересной области.
Что же такое Data Science? Data Science — это наука о данных, которая сочетает в себе программирование, машинное обучение, математику и ряд других дисциплин. Наука довольно сложная и требует разностороннего развития, а также постоянного улучшения своих знаний и навыков.
Начинающему специалисту необходимо уметь писать код на языке Python и анализировать свою работу. Необходимо также уверенно знать английский язык, так как большая часть действительно годной литературы не переведена на русский язык, а кроме того, вам часто придется сталкиваться с различными терминами и понятиями.
Мы собрали для вас 10 книг, которые должен прочитать каждый Data Scientist и тот, кто хочет им стать.
Python Tricks: The Book
Книга Python Tricks: The Book подойдет тем, кто уже начал свой путь в изучении языка Python. Речь пойдет о различных хитрых трюках, которые вы можете применить во время разработки. Они помогут вам не только научиться программировать лучше, но и быстрее, а также качественнее.
В книге рассматриваются основы языка Python, а также различные конструкции, которые будут полезны как новичкам, так и тем, кто уже знаком с языком. Кроме того, из книги вы узнаете необходимые шаблоны, эффективные функции, классы и ООП, общие структуры данных, циклы и многое другое. Помочь разобраться в многообразии терминов вам поможет словарь.
Learning Python
Learning Python максимально подробно расскажет вам об основах данного языка программирования, который любим разработчиками за простоту, скорость разработки и универсальность. Книга объяснит вам весь необходимый материал, включая основные типы объектив, порядок работы с ними, функции, классы и модули, а также многое другое.
Самый большой плюс книги — это контрольные вопросы, которые вы найдете в конце каждой главы. Они помогут закрепить пройденный материал, а также решить некоторые задачи.
Numsense! Data Science for the Layman
Annalyn Ng, Kenneth Soo
Данная книга научит вас понимать основы работы Data Science и Big Data. Информации много и она изложена весьма доступно, что поможет вам разобраться в основах. Понимать изложенную информацию помогает «Глоссарий», в котором вся теория изложена другими словами.
Будьте готовы к большому объему теории, так как книга захватывает достаточно большой объем данных. Однако у вас уже будет представление о том, с чем вы собираетесь работать. Все таки Data Science — это действительно обширная наука, изучение которой требует большого вложения времени и сил.
Data Science from Scratch
«Data Science from Scratch» — это отличное пособие для новичков, которое затрагивает вопросы аналитики, программных библиотек, модулей, пакетов инструментов, платформ и многого другого. Если вы в ладах с математикой, то вам будет ощутимо проще погрузиться в Data Science, которая плотно идет рука об руку с этой сферой.
Кроме того, книга содержит интенсивный курс языка Python, элементы статистики, линейной алгебры, теории вероятности, основы работы с рекомендательными системами и многое другое. Пожалуй, для начала, это одна из самых сильных и полезных книг, которую только можно найти.
Automate the Boring Stuff with Python: Practical Programming for Total Beginners
Данная книга не сделает из вас специалиста по Data Science, но поможет научиться автоматизировать все рутинные задачи, которые занимают время. С помощью данной книги вы сможете использовать Python для написания программ, которые будут делать за вас рутинные задачи — переименовывать файлы, обновлять таблицы и многое другое.
Для написания всех этих программ вам нужно будет изучить лишь основы Python, но с их помощью вы сможете освободить большое количество времени, которое можно использовать для изучения Data Science или более углубленного погружения в Python.
Life 3.0: Being Human in the Age of Artificial Intelligence
Одна из самых популярных книг, которая рассказывает об Искусственном Интеллекте. Life 3.0: Being Human in the Age of Artificial Intelligence рассказывает о том, как изменится наша жизнь, когда ИИ будет работать стабильно, а автоматизация будет плотно внедрена во все системы. Если вы хотите узнать, как технологии повлияют на нашу жизнь с повсеместным приходом Искусственного Интеллекта, то эта книга будет вам полезна.
Кроме того, данная книга рассказывает о том, какие последствия могут быть у такого быстрого развития. Несмотря на то, что данная книга не является учебным пособием, она очень глубоко рассматривает тему Искусственного Интеллекта и показывает его работу.
Machine Learning
Если вы еще ничего не знаете об Искусственном Интеллекте, то начать знакомство стоит с этой книги. Ее автор, Том Митчелл, основал первую в мире кафедру Машинного обучения и за свою жизнь опубликовал огромное количество работ, связанных с Искусственным Интеллектом. Книга расскажет вам о Машинном обучении, начиная с самых азов, причем доступным и понятным языком.
В данном пособии рассматривается не только Искусственный Интеллект, но и статистика, нейронные сети, байесовское обучение и многое другое, что будет полезно узнать новичкам.
Doing Data Science
Rachel Schutt, Cathy O’Neil
Doing Data Science подойдет тем специалистам, которые уже изучили самые базовые понятия Data Science и делают первые шаги в углублении своих знаний. Книга также содержит вводную информацию по Big Data, а также рассказывает о работе фильтрации спама, регрессионных моделях и рекомендательных машин.
Данное пособие является эдаким «мостом» между литературой для новичков и серьезными техническими изданиями. Поэтому ее рекомендуется изучить прежде, чем вы начнете углубляться в изучение Data Science.
A Student’s Guide to Python for Physical Modeling
Jesse Kinder, Philip Nelson
A Student’s Guide to Python for Physical Modeling будет полезна не только студентам, но и тем, кто начинает изучать Python и Data Science. С ее помощью вы изучите не только настройку среды программирования, но и сможете понять основы моделирования.
Книга объясняет теорию понятным для понимания языком и, более того, содержит образцы кода, а также различные упражнения, которые помогут вам закрепить знания и попробовать применить их на практике. Пожалуй, это пособие одно из тех, которое действительно строго рекомендуется к прочтению каждому, кто начинает изучать Data Science.
Глубокое обучение. Погружение в мир нейронных сетей
С. Николенко, А. Кадурин, Е. Архангельская
О Data Science выходит не так много книг на русском языке и от русских авторов. Однако, если вы начинаете изучать Data Science, Машинное обучение и Нейронные сети, то вам необходимо с ней ознакомиться. В ней рассматриваются новые архитектуры, алгоритмы обучения и многое другое, причем все объясняется доступным и понятным языком.
Если вы уже изучили основы и понимаете, что пора двигаться дальше, то эта книга станет лучшим выбором. В ней вы найдете множество примеров, научных историй, ссылок и многое другое, что необходимо при более глубоком погружении в мир Нейронных сетей и Data Science.
Хотите узнать больше о Data Science, Python, Машинном Обучение или Аналитике данных? Читайте в нашем блоге .
Научно-
образовательный
портал IQ
Список литературы: data science
В новом выпуске рубрики «Список литературы» преподаватели проекта Data Culture НИУ ВШЭ рассказывают о книгах, которые помогут разобраться в том, что такое анализ данных.
Максимально близкая к практике книга, где каждый метод разбирается на полезной задаче (от кластеризации сообщений до анализа музыкальных треков) и с кодом наPython. Рекомендуем всем, кто уже умеет программировать и хочет получить опыт построения моделей, который можно будет сразу же использовать в своих задачах. Книга отвечает на множество вопросов: как следует обрабатывать данные так, чтобы алгоритмы машинного обучения могли извлечь максимум пользы? Как выбрать правильный алгоритм для решения проблемы? Почему один алгоритм превосходит другой в конкретном сценарии? Автор книги – Уили Ричерт, PhD в области машинного обучения и робототехники, в настоящее время работает в Microsoft в Bing Core Relevance Team.
Книга для тех, кого запугала школьная математика, представив великую науку в виде череды уравнений. В книге цифры, числа и задачи превращаются в замысловатый логический танец в пространстве мыслей. Её автор – Стивен Строгац, американский математик, профессор Корнелльского университета, писал статьи для газеты The New York Times, где максимально просто объяснял самые сложные понятия. В книгу вошли опубликованные материалы и новые главы. В предисловии Строгац пишет: «Математика повсюду, надо только научиться ее узнавать. Можно разглядеть синусоиду на спине зебры, услышать отголоски теорем Евклида в Декларации о независимости; да что там говорить, даже в сухих отчетах, предшествовавших Первой мировой войне, присутствуют отрицательные числа. Также можно увидеть, как на нашу сегодняшнюю жизнь влияют новые направления математики, например, когда мы ищем рестораны с помощью компьютера или пытаемся хотя бы понять, а еще лучше — пережить пугающие колебания фондового рынка».
Программируем коллективный разум
Тоби Сегеран
Отличная прикладная книга, которая «на пальцах» объясняет некоторые современные алгоритмы машинного обучения, с примерами кода на языке Python. Особенно подробно описаны алгоритмы классификации и кластеризации. Автор книги Тоби Сегеран пишет: «Цель этой книги – помочь вам перейти от простых приложений, хранящих данные в базе, к написанию более интеллектуальных программ, способных эффективно пользоваться той информацией, которую вы и другие люди накапливают каждодневно».
Автор Пол Локхард мастерски и со всех сторон критикует современное школьное математическое образование, предлагая прекрасный подход к ее изучению. Пол Локхард начал преподавать математику в начальной школе, защитил диссертацию в университете Коламбия, был сотрудников Института математических исследований (MSRI) и профессором в университете. Но потом вернулся в школу, преподавать математику во всех классах – от подготовительного до выпускного.
Одна из базовых книг по машинному обучению, авторы которой придумали немало методов, использующихся сегодня профессионалами каждый день. Взять хотя бы градиентный бустинг, предложенный Фридманом в 1999 году, а сегодня применяемый, например, для построения поисковых движков и рекомендательных систем. Многие курсы по машинному обучению основываются именно на этой книге.
Одна из лучших книг про анализ текстов и связанные задачи. Рассказ идёт от самых основ и простейших методов вроде регулярных выражений, а заканчивается рекуррентными нейросетями, построением диалоговых систем и прочими продвинутыми разделами. В процессе описания единого видения речевой и языковой обработки авторы собирают воедино те области, которые традиционно преподаются отдельно на разных курсах: распознавание речи, синтаксический анализ, семантическая интерпретация и лингвистическая прагматика, вычислительная морфология и фонология и многие другие. После прочтения этой книги, пишут авторы, станет понятно, насколько далёк от реальности был Артур Кларка, когда создавал своего персонажа – говорящего робота HAL из «Космической Одиссеи: 2001».
Развитие науки о данных влияет на множество аспектов деятельности человека, меняется даже сам научный подход. Эта книга рассматривает изменения, связанные с развитием современных методов анализа данных, происходящие в социальных науках. В книге много содержательных примеров и рекомендаций для исследователей и аналитиков. Мэтью Дж. Салганик – профессор социологии в Принстонском университете, где он также работает с Центром политики в области информационных технологий и Центром статистики и машинного обучения. Его исследования финансировались Microsoft, Facebook и Google.