Zoznam 10 najlepších kníh vedy o údajoch a popisov pre všeobecných používateľov

Zoznam 10 Najlepsich Knih Vedy O Udajoch A Popisov Pre Vseobecnych Pouzivatelov



Data Science je študijný odbor, ktorý spracováva obrovské množstvo údajov pomocou vedeckých metód, procesov, algoritmov a systémov na nájdenie neviditeľných vzorov, odvodenie zmysluplných informácií, prijímanie obchodných rozhodnutí v spoločnostiach a tiež použitie v nepodnikateľských inštitúciách. Medzi nepodnikateľské inštitúcie patria odvetvia pre zdravotníctvo, hry, rozpoznávanie obrázkov, systémy odporúčaní, logistiku, odhaľovanie podvodov (bankové a finančné inštitúcie), vyhľadávanie na internete, rozpoznávanie reči, cielenú reklamu, plánovanie leteckých liniek a rozšírenú realitu. Data Science je podskupina umelej inteligencie. Údaje, ktoré sa používajú na analýzu, môžu pochádzať z mnohých rôznych zdrojov a sú prezentované v rôznych formátoch. Niektoré zo zdrojových údajov môžu byť štandardizované; iné nemusia byť štandardizované.

Inými slovami, na zhromažďovanie údajov sa používajú rôzne metodológie (množné číslo dátumu). Potom sa zo zhromaždených údajov extrahujú poznatky (hodnotné závery). V tomto procese, po zhromaždení údajov, sa na nich (údajoch) vykonáva výskum s cieľom získať nové údaje (výsledky), z ktorých sa riešia problémy.







Dátová veda ako (hlavná) disciplína existuje na bakalárskej a magisterskej úrovni na univerzite. Len málo univerzít na svete však ponúka Data Science na bakalárskom alebo magisterskom stupni. Na úrovni bakalárskeho štúdia študent získa titul v odbore Data Science. Je to ako všeobecný titul. Na magisterskej úrovni študent odchádza s postgraduálnym titulom v odbore dátová veda so špecializáciou na dátovú analýzu, dátové inžinierstvo alebo ako dátový vedec.



Čitateľa môže prekvapiť a možno aj nanešťastie, že strojové učenie, modelovanie, štatistika, programovanie a databázy sú nevyhnutnými znalosťami pre štúdium dátovej vedy na bakalárskom stupni štúdia napriek tomu, že ide o uznávané vysokoškolské predmety, ktoré študujú v iné odbory na bakalárskom stupni alebo magisterskom stupni. Bez ohľadu na to, keď študent ide na univerzitu študovať Data Science na úrovni vysokoškolského štúdia, všetky tieto kurzy sa budú stále študovať popri alebo pred riadnymi kurzami pre Data Science.



Dátová veda pre bakalárske štúdium alebo jej špecializácie, ako je dátová analýza, dátové inžinierstvo alebo ako dátový vedec, sa stále vyvíjajú; hoci po štúdiu (na univerzite) dosiahli štádium, že sa uplatňujú v priemysle. Dátová veda je celkovo relatívne veľmi nová disciplína.





Pamätajte, že predtým, ako sa stanete špecialistom, by ste mali byť všeobecným lekárom. Rozdiely medzi programami špecialistov ešte nie sú jasné. Rozdiely medzi všeobecnými a špecializovanými programami ešte nie sú jasné.

Keďže Data Science je relatívne nová disciplína, knihy predpísané v tomto dokumente sú založené na pokrytí obsahu a nie na pedagogike (ako dobre kniha učí). A sú pre bakalársky (všeobecný) program. Existujú rôzne všeobecné kurzy.



Zoznam

Pre viac podrobností a prípadný nákup kreditnou kartou je pri každej knihe uvedený hypertextový odkaz. Ani jedna z kníh nepokrýva všetky všeobecné kurzy.

Základná matematika pre vedu o údajoch: počet, štatistika, teória pravdepodobnosti a lineárna algebra

Napísal: Hadrien Jean

  • Vydavateľ: Hadrien Jean
  • Dátum zverejnenia: po 30. septembri 2020
  • Jazyk: angličtina
  • Počet strán: viac ako 400

Obsah tejto knihy možno považovať za matematický kurz pre Data Science. Hoci sa neodporúča učiť sa Data Science sám, absolvent strednej školy, ktorý sa chce učiť Data Science sám, by mal začať s touto knihou.

Obsah: Počet; Štatistika a pravdepodobnosť; Lineárna algebra; Skaláre a vektory; Matice a tenzory; Rozpätie, lineárna závislosť a transformácia priestoru; Systémy lineárnych rovníc; Vlastné vektory a vlastné hodnoty; Dekompozícia singulárnej hodnoty.

https://www.essentialmathfordatascience.com/

Sprievodca zdravým rozumom k dátovým štruktúram a algoritmom: Zvýšte úroveň svojich základných programovacích zručností / 2. vydanie

Napísal: Jay Wengrow

  • Vydavateľstvo: Pragmatic Bookshelf
  • Dátum zverejnenia: 15. september 2020
  • Jazyk: angličtina
  • Rozmery: 7,5 x 1,25 x 9,25 palca
  • Počet strán: ‎508

Táto kniha sa zaoberá algoritmami a dátovými štruktúrami, ktoré sa používajú v dátovej vede. Za predpokladu, že sa niekto učí Data Science sám po absolvovaní strednej školy, potom je to ďalšia kniha, ktorú si môžete prečítať po prečítaní predchádzajúcej knihy o matematike. Príklady programov sú uvedené v jazykoch JavaScript, Python a Ruby.

Obsah: Prečo na dátových štruktúrach záleží; Prečo na algoritmoch záleží; O áno! Veľký O zápis; Zrýchlenie kódu pomocou Big O; Optimalizácia kódu s a bez Big O; Optimalizácia pre optimistické scenáre; Veľké O v každodennom kóde; Rýchle rýchle vyhľadávanie pomocou hash tabuliek; Vytváranie elegantného kódu s balíkmi a frontami; Rekurzívne rekurzovanie s rekurziou; Naučiť sa písať rekurzívne; Dynamické programovanie; Rekurzívne algoritmy pre rýchlosť; dátové štruktúry založené na uzloch; Urýchlenie všetkých vecí pomocou binárnych vyhľadávacích stromov; Udržiavanie vašich priorít priamo s hromadami; Nie je na škodu vyskúšať; Prepojenie všetkého s grafmi; Riešenie priestorových obmedzení; Techniky pre optimalizáciu kódu

Smarter Data Science: Úspech s podnikovými dátami a projektmi AI / 1 sv Úprava

Napísal: Neal Fishman, Cole Stryker a Grady Booch

  • Vydavateľ: Wiley
  • Dátum zverejnenia: 14. apríla 2020
  • Jazyk: angličtina
  • Počet strán: ‎286

Obsah: Lezenie po AI rebríku; Rámcová časť I: Úvahy pre organizácie používajúce AI; Rámcová časť II: Úvahy o práci s údajmi a AI; Pohľad späť na Analytics: Viac ako jedno kladivo; Pohľad do budúcnosti na analýzu: Nie všetko môže byť klinec; Riešenie operačných disciplín na rebríčku AI; Maximalizácia využitia vašich údajov: Riadenie hodnoty; oceňovanie údajov pomocou štatistickej analýzy a umožnenie zmysluplného prístupu; Dlhodobá výstavba; A Journey's End: IA pre AI.

Strojové učenie: pravdepodobnostná perspektíva (séria adaptívnych výpočtov a strojového učenia) Ilustrované vydanie

Napísal: Kevin P. Murphy

  • Vydavateľ: The MIT Press
  • Dátum zverejnenia: 24. august 2012
  • Jazyk: angličtina
  • Rozmery: 8,25 x 1,79 x 9,27 palca
  • Počet strán: ‎1104

Táto kniha je vhodná pre začiatočníkov. Opäť, rovnako ako všetky ostatné knihy predpísané v tomto dokumente, ani táto kniha nepokrýva všetko potrebné pre všeobecný program, ktorý, žiaľ, stále nie je dokončený (špecializované programy tiež stále nie sú dokončené). Typickým začiatočníkom je tu stredoškolák s maturitou z matematiky a informatiky.

Obsah: Úvod (Strojové učenie: čo a prečo?, Učenie bez dozoru, Niektoré základné pojmy strojového učenia); Pravdepodobnosť; Generatívne modely pre diskrétne dáta; Gaussove modely; Bayesovská štatistika; Frekvencia štatistiky; Lineárna regresia; Logistická regresia; Zovšeobecnené lineárne modely a exponenciálna rodina; Riadené grafické modely (Bayesove siete); Zmiešané modely a EM algoritmus; Latentné lineárne modely; Zriedkavé lineárne modely; jadrá; Gaussove procesy; Adaptívne základné funkčné modely; Markov a skryté Markov modely; Modely stavového priestoru; Neorientované grafické modely (Markovove náhodné polia); Presné odvodenie pre grafické modely; Variačná inferencia; Viac variačných záverov; Monte Carlo záver; Markov reťazec Monte Carlo (MCMC) odvodenie; Zhlukovanie; učenie sa štruktúry grafického modelu; Modely latentných premenných pre diskrétne dáta; Hlboké učenie.

Data Science for Business: Čo potrebujete vedieť o dolovaní údajov a analytickom myslení / 1. vydanie

Napísal: Tom Fawcett a Foster Provost

  • Vydavateľ: O'Reilly Media
  • Dátum zverejnenia: 17. september 2013
  • Jazyk: angličtina
  • Rozmery: 7 x 0,9 x 9,19 palca
  • Počet strán: ‎413

Obsah: Dátovo-analytické myslenie; Obchodné problémy a riešenia pre vedu o údajoch; Úvod do prediktívneho modelovania: Od korelácie k riadenej segmentácii; Prispôsobenie modelu údajom; nadmerné vybavenie a jeho zamedzenie; Podobnosť, susedia a zhluky; Rozhodovacie analytické myslenie I: Čo je dobrý model?; Vizualizácia výkonnosti modelu; Dôkazy a pravdepodobnosti; Zastupovanie a ťažba textu; Rozhodovacie analytické myslenie II: Smerom k analytickému inžinierstvu; Iné úlohy a techniky v oblasti dátovej vedy; Dátová veda a obchodná stratégia; Záver.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Praktická štatistika pre dátových vedcov: 50+ základných konceptov pomocou R a Pythonu / 2. vydanie

Napísali: Peter Bruce, Andrew Bruce a Peter Gedeck

  • Vydavateľ: O'Reilly Media
  • Dátum zverejnenia: 2. júna 2020
  • Jazyk: angličtina
  • Rozmery: 7 x 0,9 x 9,1 palca
  • Počet strán: ‎368

Obsah: Prieskumná analýza údajov, distribúcie údajov a vzoriek, štatistické experimenty a testovanie významnosti, regresia a predikcia, klasifikácia, štatistické strojové učenie, učenie bez dozoru.

Kniha Prečo: Nová veda o príčine a následku

Napísal: Judea Pearl, Dana Mackenzie

  • Vydavateľstvo: Basic Book
  • Dátum zverejnenia: 15. máj 2018
  • Jazyk: angličtina
  • Rozmery: 6,3 x 1,4 x 9,4 palca
  • Počet strán: ‎432

Zatiaľ čo mnoho kníh Data Science používa na ilustráciu čistý obchodný priemysel, táto kniha používa na ilustráciu medicínsky priemysel a iné disciplíny.

Obsah: Úvod: Myseľ nad dátami; Rebrík príčinnosti; Od bukanýrov k morčatám: Genesis of Causal Inference; Od dôkazov k príčinám: Reverend Bayes sa stretáva s pánom Holmesom; Confounding and Deconfounding: Or, Slaying the Lurking Variable; Debata plná dymu: Vyčistenie vzduchu; Množstvo paradoxov!; Beyond Adjustment: The Conquest of Mount Intervention; Kontrafakty: Ťažobné svety, ktoré mohli byť; Mediácia: Hľadanie mechanizmu; Veľké dáta, umelá inteligencia a veľké otázky.

Vybudujte si kariéru v dátovej vede

Napísal: Emily Robinson a Jacqueline Nolis

  • Vydavateľ: Manning
  • Dátum zverejnenia: 24. marca 2020
  • Jazyk: angličtina
  • Rozmery: 7,38 x 0,8 x 9,25 palca
  • Počet strán: ‎354

Obsah: Začíname s Data Science; Vyhľadanie zamestnania v oblasti Data Science; Usadenie sa v Data Science; Rast vo vašej úlohe Data Science.

https://www.manning.com/books/build-a-career-in-data-science

Data Science for Dummies / 2. vydanie

Napísal: Lillian Pierson

  • Vydavateľ: For Dummies
  • Dátum zverejnenia: 6. marca 2017
  • Jazyk angličtina
  • Rozmery: 7,3 x 1 x 9 cm
  • Počet strán: ‎384

Táto kniha predpokladá, že čitateľ už má vopred požadované znalosti z matematiky a programovania.

Obsah:  Omotajte hlavu okolo Data Science; Skúmanie potrubí a infraštruktúry dátového inžinierstva; Aplikácia údajov založených na prehľadoch v obchode a priemysle; Strojové učenie: učenie sa z údajov s vaším strojom; Matematické, pravdepodobnostné a štatistické modelovanie; Použitie klastrovania na rozdelenie údajov; Modelovanie s inštanciami; Budovanie modelov, ktoré prevádzkujú zariadenia internetu vecí; Dodržiavanie zásad návrhu vizualizácie údajov; Použitie D3.js na vizualizáciu údajov; Webové aplikácie pre návrh vizualizácie; Skúmanie osvedčených postupov v dizajne palubnej dosky; Vytváranie máp z priestorových údajov; Používanie Pythonu pre vedu o údajoch; Používanie Open Source R pre dátovú vedu; Používanie SQL v Data Science; Robiť dátovú vedu s Excelom a Knime; Data Science in Journalism: Nailing Down the Five Ws (a H); Ponorenie sa do vedy o environmentálnych údajoch; Dátová veda na podporu rastu v elektronickom obchode; Použitie Data Science na opis a predpovedanie trestnej činnosti; Desať fenomenálnych zdrojov pre otvorené dáta; Desať bezplatných nástrojov a aplikácií pre dátovú vedu.

Ťažba veľkých súborov údajov / 3 rd Úprava

Napísal: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Vydavateľ: Cambridge University Press
  • Dátum zverejnenia: 13. februára 2020
  • Jazyk angličtina
  • Rozmery: 7 x 1 x 9,75 palca
  • Počet strán: ‎565

Táto kniha tiež predpokladá, že čitateľ už má vopred požadované znalosti z matematiky a programovania.

Obsah: dolovanie údajov; MapReduce a nový balík softvéru; Algoritmy využívajúce MapReduce; Hľadanie podobných položiek; Ťažba dátových tokov; Analýza odkazov; Časté položky; Zhlukovanie; Reklama na webe; Odporúčacie systémy; Mining Social-Network Graphs; Zníženie rozmerov; Strojové učenie vo veľkom meradle.

Záver

Rozdiely medzi programami špecialistov ešte nie sú jasné. Rozdiely medzi všeobecnými a špecializovanými programami tiež ešte nie sú jasné. Po prečítaní daného zoznamu kníh však čitateľ bude môcť lepšie oceniť špeciálne úlohy dátového analytika, dátového inžiniera a dátového vedca a potom sa pohnúť vpred.