středa 23. května 2012

Všechno se změnilo, jako vždycky

Každý proslov představitele počítačové firmy - zdaleka se to netýká jen EMC - již léta obsahuje povinné sdělení: doba se úplně změnila. Od teď bude všechno jinak.

Vím přesně, proč to říkají (a jako veřejně vystupující člověk z oboru jsem to sám řekl i napsal mnohokrát, bůh mi odpusť). Tahle fráze totiž, jakkoli se to po tolika opakováních zdá být nemožné, pořád ještě na chvíli probudí zájem publika. Co kdyby to tentokrát byla pravda?

K několika zásadním zlomům v našem oboru totiž došlo. Podle mne byly čtyři.

První, když v dubnu 1964 uvedla IBM řadu System/360 a tím změnila počítače z nepochopitelné megamašiny v běžnou součást vybavení podniků.

Druhý, když v roce 1977 vymyslel Steve Wozniak, jak postavit levný osobní počítač a Steve Jobs, jak ho prodat.

Třetí, když v roce 1990 Tim Berners-Lee stvořil web.

Čtvrtý, když v roce 2000 Google spustil AdWords a dal tím do provozu obecně přijatelný způsob, jak za provoz užitečných věcí na síti nezaplatí ani uživatel, ani poskytovatel, ale třetí strana.

Jsem ochoten hodně opatrně připustit, že se možná schyluje k pátému zlomu, který bude mít hodně společného s data science a systémy obecně zvanými Big Data.

Možná. Všimněte si totiž, že ani jeden z těch zlomů současníci nerozpoznali jako něco zásadního, vždycky jim to chvíli trvalo. Dokonce i v případě čísla dvě, což byl z těch zlomů nejnázornější a nejviditelnější. Jistě může být, že jsme bystřejší než oni, ale moc věrohodně to nezní, že?

Všimněte si také, že slovo zlom vlastně nesedí. V mnoha ohledech to vždy byl jen bod na plynulé křivce postupné změny. Mainframy existovaly dřív, než přišel System/360. Osobní počítače dřív, než byl na trh uveden Apple II. Hypertext dřív než web. Inzertní systémy na webu dřív než AdWords (Google se ostatně musel o původnost soudit a tak docela v právu nebyl).

A ještě si všimněte, že to je hodně svévolný výběr. Nemám v něm sociální sítě, hledání na webu, umělou inteligenci, roboty, COBOL, mikroprocesor, cokoli mobilního. To všechno mi připadá jako logický důsledek oněch čtyř hlavních momentů, ale jistě to můžete vidět nějak jinak.

S výroky typu everything has changed by se mělo zacházet opatrně, ale na tohle varování je už pozdě. Všechno se mění koneckonců pořád. Jde o to, jak to chceme interpretovat, jaké příběhy vyprávět.

Většinou volíme ty, které nám přinášejí užitek. Já chci, abyste je četli. Obchodníci chtějí, abyste na jejich základě nakupovali. Občas z toho dokonce vyjde skoro stejný příběh.

XtremIO: technologie z Area 51

Pár rychlých poznámek k včerejší akci nazvané Area 51. Od začátku to inzerovali jako přísně tajné odhalení, novinářům vstup zakázán a tak dále. A čím dál tím víc bylo jasné, že se z toho vyklube nějaká taškařice.

Což se stalo. Se zvukovými a světelnými efekty předvedla EMC jednak překvapivě hodně smyslu pro humor (rozumějte: ne že by to bylo k popukání, ale bylo to docela dobré na firmu, která se normálně chová víc IBM-like než IBM sama), jednak pár zajímavostí, především v oblasti budoucích technologií. („Teď uvidíte produkty, které nemají nic společného s technologiemi a technologie, které nemají nic společného s produkty.“)

K zapamatování doporučuji jméno XtremIO: izraelský startup, který EMC letos koupila (říká se tu, že bezmíla za půl miliardy). Dělá disková pole postavená čistě z flash pamětí (takže říkat jim disková je už jen projev setrvačnosti) a brzy si prý troufne na kapacitu 1000 TB v jedné krabici (byl jsem se pak výslovně zeptat, zda jsem neslyšel špatně.)

To je dost síla. Profi flash paměť je 10 - 100x rychlejší než disk (proto se také používá), ale taky v podobném poměru dražší (byť dnes už o dost levnější než DRAM). Jestli má být 1000 TB aspoň trochu cenově přijatelných, znamená to, že Izraelci přišli na pár zajímavých triků. A EMC nakoupila dobře. Když si to porovnám s miliardou za Instagram, připadá mi, že svět upadl na hlavu.

Mimochodem, v rámci Area 51 se na pódiu také mihl Scott McNealy, někdejší šéf Sunu, hokejista, huba nevymáchaná a vůbec zajímavý chlap. Má teď startup WayIn, který se snaží využívat mechanismu Twitteru pro hlasování a shromažďování názorů - crowdsourcing. Očividně ho to baví.

V rámci zvoleného image nakonec přitáhli na pódium i mimozemšťana. Zda došlo v zákulisí na jeho pitvu, není známo.

Greenplum: analytika velkých dat

Jednou z novějších akvizicí EMC (léto 2010) je Greenplum. Startup, který vyletěl bleskově vzhůru díky své orientaci na velmi aktuální problematiku analyzování velkých datových objemů (zkusím se tomu obratu Big Data vyhnout aspoň chvílemi).

Greenplum má svůj vlastní databázový engine a nad ním analytický software. Protože se předpokládá, že půjde o objemově náročné úlohy (big je holt big), je systém postaven tak, aby pracoval paralelně. Jeho základem je prostředí Hadoop, dnes nejpoužívanější nástroj pro paralelizaci datových úloh.

Podrobnosti jindy a asi jinde: pokud to znáte, pak o tom asi víte víc než já, pokud to neznáte, pak je to s Hadoopem zhruba následujícím způsobem. Máte obsáhlou úlohu, která by při sekvenčním zpracování trvala hodně dlouho, třeba indexování obsahu webových stránek (přesně pro ten účel byly algoritmy tvořící základ Hadoopu původně vyvinuty) nebo počítání, kolikrát se které slovo vyskytuje v encyklopedii (to se dá líp představit). Abyste čas zkrátili, rozdělíte ji na mnoho menších úloh, z nichž každá poběží na samostatném procesoru nebo počítači bez komunikace s ostatními. Dostanete mnoho dílčích výsledků, a dostanete je rychle. A jsou nepoužitelné, dokud je nějak nesloučíte dohromady (máte dílčí součty počtu slov z každé stránky encyklopedie zvlášť). Což se dá udělat. Té první části algoritmu se říká Map, té druhé (slučování dílčích výsledků) Reduce, protože v ní skutečně jde o redukování výsledků, o eliminaci (a třeba sčítání počtu) duplicit. Reduce se dá podle množství dílčích výsledků dělat opakovaně, v několika krocích. Jde o stařičký algoritmus pocházející z Lispu, nehodí se na všechny typy paralelních úloh, ale právě v analýze dat většinou vyhovuje. Proto je Hadoop dnes tak známý a používaný.

Hadoop, jak je z extra stručného popisu snad jasné, není databáze, je však možné nad ním databázi postavit. Třeba Google používá svou databázi Big Table. Greenplum má nenápaditě pojmenovanou Greenplum Database.

EMC má tendenci všechno dát do krabice. Ta související se Nezralou švestkou (kde ta jména berou?) se jmenuje EMC Greenplum Data Computing Appliance. V podstatě to je datový sklad spojený s výpočetním clusterem - tedy se strojem na paralelní počítání. Má vestavěný VMAX Symmetrix, veškerý potřebný software od Greenplum, čtyři nebo čtyřidvacet výpočetních uzlů („samostatných počítačů“) a dá se doplňovat dalším softwarem třetích stran. Datová analytika plug & play! (Sotva. Ale je to důležitý krok ke standardizaci a komoditizaci. Postupuje to rychle. Věda v krabici.)

Greenplum tady na EMC Worldu ohlásil celkem zajímavou věc: spuštění tisíciuzlového klastru pod svou správou. Jmenuje se Analytics Workbench a je otevřený zdarma pro vývojáře třetích stran - pro testovací účely, nikoli pro komerční provoz (aspoň tak jsem to pochopil). Hezký dárek komunitě, bez níž by koneckonců nic z výše popsaného nebylo. Ti, kdo si díky jejím výsledkům vydělali, jí to vracejí.

Hráči

Abych nevypadal, že toho prosťáčka neupřímně předstírám: v Las Vegas jsem poprvé a o hazardních hrách vím jen tolik, že kasino vždycky vyhraje. Zdejší atmosféra mi proto připadá poněkud cirkusová, protože se na to neumím naladit emocionálně. Včera jsem ale půl hodiny pozoroval ruletu a bylo to zajímavé. U levnějšího stolu, s minimální sázkou $10. Jsou tady mnohem dražší.

Překvapilo mě napřed, jak je to veřejně přístupné, dokonce do té míry, že vlastně o hru a hráče všude zakopáváte, stačí ji jít koupit pivo a tužkové baterie. Vždycky jsem si představoval, že kasino je pseudodůstojná instituce, kam vás nepustí jen tak.

Taky jsem si myslel, že se u hry napjatě a důstojně mlčí, ale ono je to spíš jako na fotbale! Lidé se baví, pokřikují a popíjejí drinky roznášené zdarma (tedy - za spropitné, to vím od arménského taxikáře). Prakticky celé sukno je pokryté žetony, není čísla či kombinace, na které by něbyla sázka - někdo tedy vyhrát většinou musí, čímž je to zajímavější.

Nějak mi ale přišlo lepší jen se koukat a pivo si platit, než to udělat naopak. Možná je v tom trocha obavy, aby se v člověku neprobudila nějaká dobře schovaná vášeň, nevím.

V kasinu je úžasná směs oblečení a hlavně lidí; pomíchané společenské vrstvy, dámy v malých černých a na jehlách stejně jako maminy v květovaných halenách rozměrů stanu a odrbaných teniskách. Chlapi vypadají homogenněji.

Mimochodem, je to snad jediné místo v Americe (no, to ne: ale v Nevadě prý ano) , kde se ještě smí kouřit v místnosti. Leckdo sem jde jen a právě proto. (Venku je i v noci horko.)

Ruleta je fajn, protože tam komunikujete s lidmi. A asi ještě lepší jsou karty, kde záleží na tom, co dovedete. Totálně ale nechápu hráče u automatů. Většina vypadá unaveně, uzavřeně, bez zájmu o okolí. Strkají papírky do škvíry a mačkají páku. Mohly by to dělat opice. Jen by je to asi nebavilo tak dlouho. (I když - za banány či za přístup k opicím opačného pohlaví asi ano. A v tom to je.)

Nefilozofuju a nesoudím, jen se dívám.

 

úterý 22. května 2012

Capellas, aneb všechno v jedné krabici

Dalším veteránem na scéně je Michael Capellas. Proslavil se v době, kdy byl šéfem Compaqu a řidil jeho prodej společnosti HP. Moc populární nebyl, protože ta transakce sama nebyla moc populární. (Dnešní vývoj v HP jako by tehdejší názory zpětně ospravedlňoval. Ale Compaq tou dobou byl už sám vykolejený a kdyby ke spojení nedošlo, stejně by asi dlouhodobě neobstál.) Capellas byl pak nějakou dobu prezidentem „HPaqu“ (prezidentem, ne CEO, rozhodující pozici zastávala železná dáma Carly Fiorina).

Dnes stojí v čele VCE neboli Virtual Computing Environment Company, což je společný podnik firem EMC a Cisco, v němž má peníze také Intel a VMware.


Produktem VCE je řada Vblock, což je... datacentrum v krabici. Anebo cloud v krabici, jestli chcete. Vblock je skříň jak hrom, Uvnitř najdete switche (značky Cisco, samozřejmě), nějaké to diskové pole od EMC (u vyšších modelů to bývá VMAX Symmetrix), přiměřené množství intelských blade serverů UCS (výrobce též Cisco - ano, Cisco dělá servery, už dost dlouho), a dál middleware, obslužný software a veškerý další ware (EMC, VMware i Cisco).

Dělá se to na zakázku, kombinovat jednotlivé prvky lze různým způsobem. A k čemu je to dobré? Běží na tom virtuální x86 servery. Stovky až tisíce podle konfigurace.

Technologicky to není nic zásadního: integrované řešení složené z hotových prvků. Obchodně to je vtipné, protože zákazník dostane plně funkční celek, jedno číslo na technickou podporu (to je hodně důležité; jistě jste už někdy slyšeli „za to my nemůžeme, obraťte se na tu druhou firmu“?) Výrobci, místo toho, aby se konkurenčně potírali, se takto užitečně spojují. Jednak ku prospěchu zákazníka, jednak si navzájem nekazí ceny. Tak to chodí.

Integrované řešení zkrátka znamená, že to dostanete v jedné krabici, jedno i druhé.

Šéf VMware na scéně

Paul Maritz je veterán počítačového byznysu. Jihoafričan, který koncem devadesátých let dosáhl prvního vrcholu své kariéry - v dresu Microsoftu. Byl tehdy ve firmě trojkou (tedy jedničkou po nesesaditelné dvojici Gates - Ballmer) a jeho úkolem bylo vyřešit podivnou krizi, v níž se MS tehdy ocitl: úspěšný, ale bez perspektivy, jak pokračovat. Byla to doba antimonopolních procesů, doba, kdy nervózní Microsoft nedopřával třetím stranám mnoho prostoru, chtěl všechno pro sebe.

Maritz, silně technicky orientovaný manažer, ukázal nové cesty v oblasti back i front office a především dokázal získat vytrácející se důvěru vývojářů softwaru. Mluvil s nimi na rovinu, jako programátor s programátory. Pamatuju jeho neuvěřitelnou přednášku v Amsterdamu, kde ho vývojářská elita Evropy uvítala pískotem a o půl hodiny později vyprovodila potleskem.

A Maritz byl taky tvrďák, který prosadil v Microsoftu zásadu eating our own dog food. Tedy: co vyvineme, to ještě v betě začneme v celé firmě naostro používat. Prý tu frázi dokonce vymyslel. Ani bych se nedivil: ta formulace nevypadá na nikoho z marketingu...

Proč to povídám? Protože dnes je Maritz šéfem VMware, firmy, která je součástí EMC. Za chvíli tady začne mluvit.

pondělí 21. května 2012

K nevysvětlení

Většina nových oznámení se týká „jen“ kvalitativních změn. Rychlejší, s větší kapacitou, podporuje více databázových systémů. Žádná převratná změna. A navíc je to strašně, nestravitelně technické. Zkuste udělat zprávu do novin z toho, že nový Avamar 6.1 je na virtuálních systémech VMware třikrát rychlejší než nejbližší konkurent při backupu a třicetkrát při obnovení dat! (A kdybyste to přece jen nějak dokázali, zkuste tam prosadit ten vykřičník!)

Přitom je to pořádný úspěch a vykřičník si celkem zaslouží. Rychlost je u zálohování i obnovení zásadním faktorem. Při zálohování proto, že je nejlépe dělat je, když není systém v provozu (nebo je přinejmenším ten provoz utlumen na minimum). To většinou znamená - v noci. A noc není dlouhá, noc úředně trvá osm hodin a těm osmi hodinám se říká zálohovací okno. Do něj je třeba se vejít, jinak to začne být komplikované. A jelikož dat je čím dál tím víc, jak jsme si už řekli, musí se toho během zálohovacího okna také stihnout víc než dřív. Takže...

Rychlost obnovy dat je zase klíčová z hlediska kontinuity provozu. Všichni známe frustraci, když to či ono nejede - elektronické bankovnictví, zpravodajský web, Facebook. Po většině systémových havárií je zapotřebí obnovit nějaká data ze záloh. Takže...

Takže pořád ještě musíte vysvětlit, co to je ten Avamar, co to je VMware, koneckonců i co to je zálohování a obnova. Vysvětlit se to dá. Dokonce i tak, aby to bylo ke čtení pro laiky, i když to už dá dost práce. Co se nedá, je protlačit takové věci do novin, nedejbože televize - tedy u nás; v britských a německých denících takové věci občas najdete.

Občas si myslím, že propast mezi tím, jak svět funguje a tím, co o něm většina lidí ví, je strašná, větší než kdykoli dřív. Kombinace: úzké hluboké expertní znalosti; neuvěřitelně dokonalé technologie; důvěra; a mlhavý předpoklad, že se příliš nezmění podmínky, v nichž/díky nimž to všechno pracuje. Připadá mi to jako recept na průšvih. Ale to jsme jinde, tohle samozřejmě nespraví, když dobře vysvětlíte Avamar.

Jak řekl medvídek Pú: jsou dny, kdy ti vůbec nepomůže, že umíš správně napsat slovo myslivec.