. El blog de la Núria Masdéu: 08.2014

13.8.14

Curs en línia de data journalism

Aquests darrers mesos he cursat el meu primer curs MOOC (Massive Online Open Course). Es titulava Doing journalism with data: first steps, skills and tools i l’oferia l’European Journalism Centre. Ha estat molt interessant! Era sobre periodisme de dades.

El curs estava estructurat en cinc mòduls diferents, cada un dels quals amb quatre temes diferents:
  1. Periodisme de dades a la redacció
  2. Trobar dades per donar suport a notícies
  3. Trobar ides de notícies amb anàlisi de dades
  4. Fer front a dades desordenades
  5. Explicar notícies visualment
Cada un d’aquests mòduls el liderava un professor diferent, tots ells excel·lents. Professionals reconeguts en el camp del periodisme de dades: Simon Rogers, Paul Bradshaw, Steve Doig, Nicolas Kayser-Bril i Alberto Cairo.

En cada un dels temes teníem a disposició un vídeo del professor explicant la lliçó, un test online i havíem de fer una aportació al fòrum de discussió. Al final de tots els mòduls havíem de passar un test i, si s’aconseguia el 70% de les respostes positives, s'obtenia el títol. 

L’experiència ha estat molt bona. He pogut compaginar-ho amb la vida laboral i familiar, he pogut formar-me una idea força aproximada de què és el periodisme de dades, eines a utilitzar, idees periodístiques, bones i males pràctiques, etc. 

I no només això, la tecnologia permet tot això i també que una persona qualsevol pugui tenir a l’abast un coneixement i uns professionals de gran valor i reconeixement. M’ho he passat pipa!

Això sí: l’anglès, mandatori. Tot i que els vídeos es podien visualitzar amb subtítols, tota la comunicació ha estat en anglès. Entre això i la meva feina actual al departament de comunicació del Barcelona Supercomputing Center, veig i visc que l’anglès és essencial avui en dia per a progressar. Val la pena mirar les sèries i pel·lícules en versió original i posar els dibuixos als fills en anglès. Hem de millorar encara en aquest aspecte.

7.8.14

El paper de la Xina en el camp de la supercomputació i la recerca científiques

Cada mig any es dóna a conèixer una actualizació de la llista TOP500 de la supercomputació. Es tracta d’un rànquing dels primers 500 supercomputadors del món, llistats per rendiment (LINPACK). La darrera actualització va tenir lloc aquest mes de juny passat, coincidint amb la conferència europea de supercomputació (ISC14). Per tercera vegada consecutiva, el primer supercomputador és el Tianhe-2, de la Xina, amb gairebé 34 petaflops.

La presència de la Xina en el món de la supercomputació ha crescut molt ràpidament els últims anys. El juny de 2008 representava el 2,4% de quota per Estats i l’1,2% de quota per rendiment. El juny de 2013, només cinc anys després, suposa una quota del 13,2% per Estats i el 21,2% per rendiment. En aquests moments, la Xina té una quota del 15,2% del total de la supercomputació (amb 76 sistemes), per darrere dels EUA (46,4% o 232 sistemes).


Els entesos diuen, però, que la Xina té dos problemes força grans: que inverteix massa en hardware i poc en software i que els costos operacionals se li disparen. Només per al Tianhe-2 gasta entre 65.000 i 100.000 dòlars diaris (!!!!) d’electricitat.


La màquina s’ha dedicat a projectes de disseny de ferrocarrils i línies de ferrocarrils, a l’astrofísica i a la genètica, al 34% de la seva capacitat. Ara bé, com que des de la institució que el gestiona no es dóna suport en software, els usuaris s’han vist forçats a escriure els programes ells mateixos. Estem parlant que el Tianhe-2 té més de 3 milions de cores.

Crear aplicacions per córrer en paral•lel sobre ingents quantitats de cores no és gens fàcil. Ara fa poques setmanes era notícia que el codi Alya, creat al Barcelona Supercomputing Center, s’havia escalat amb èxit fins als 100.000 cores, al supercomputador Blue Waters, situat al National Center for Supercomputing Applications de la Universitat d’Illinois a Urbana-Champaign (EUA).

Ara per ara, el rendiment dels supercomputadors es mesura en l’escala dels petaflops, és a dir, 1015 operacions de coma flotant per segon. El MareNostrum, ubicat al Barcelona Supercomputing Center, pot arribar a fer mil cent bilions d’operacions per segon (té un rendiment pic d’1,1 petaflops). Ocupa la posició 41 del llistat TOP500 (juny 2014).

Les previsions sembla que indiquen que en uns sis anys es podria arribar a l’exascala (1018 operacions de coma flotant per segon) però cal resoldre, abans, alguns obstacles, com el de l’eficiència energètica. [Per cert, no tothom el veu clar, aquest horitzó del 2020 per arribar a l’exascala. El director del Lawrence Berkeley National Laboratory al NERSC (National Energy Research Scientific Computing Center), ha apostat 20.000 dòlars de la seva butxaca personal que no tindrem sistemes d’exascala el 2020.]

No tota l’energia que gasta un supercomputador el gasta als cores. En els sistemes actuals, els processadors necessiten un gran volum d’energia, sovint un 40% o més. L’energia restant s’utilitza per a l’activació de les memòries, la xarxa d’interconnexió i el sistema d’emmagatzematge. Una part important es desaprofita en el subministre elèctric i en la refrigeració, que impedeix un rendiment òptim. Així ho explicava Àlex Ramírez, coordinador fins fa uns dies del projecte Mont-Blanc. Es tracta d’un projecte europeu que vol produir un nou tipus d’arquitectura computacional capaç de sentar les bases globals dels estàndards en l’àmbit de la supercomputació. Aquest nou sistema consumiria de 15 a 30 vegades menys d’energia, gràcies a l’ús de tecnologies àmpliament utilitzades en dispositius mòbils.

El novembre de l’any passat 2013, el projecte anunciava que les seves targetes computacionals (compute cards) tenien un rendiment 3,5 més gran pel 50% del consum energètic que les plataformes prèvies basades en ARM. Pels entesos en arquitectura computacional: http://montblanc-project.eu/press-corner/news/first-mont-blanc-compute-cards-35-times-higher-performance-half-energy

La Unió Europea finança amb 74 milions d’euros fins a 6 projectes diferents específicament centrats en l’exascala: Mont-Blanc, Cresta, Deep, Epigram, Exa2CT i Numexas. Mantenen reunions periòdiques conjuntes i participen en sessions conjuntes en conferències i reunions formatives.

Un dels centres de supercomputació més grans del món, el Lawrence Livermore (EUA) compta amb sis mil treballadors i un finançament d’1,5 mil milions de dòlars l’any passat, la majoria del govern. I sembla que cada vegada reben més finançament privat. Les possibilitats de la supercomputació en la indústria són molt grans. Com a anècdota, les patates Pringles van ser dissenyades a través de la supercomputació, per evitar que, en la línia de producció, saltessin i caiguessin a terra.

La Xina no només aposta per la supercomputació, sembla que també vol posicionar-se en la física de partícules amb un nou col•lisionador, que podria estar en marxa el 2028 i que tindria 52 quilòmetres (el del CERN en té 27). Aquest nou col•lisionador seria tant d’electrons com de positrons.

I no acaba aquí l’expansió xinesa en recerca i investigació científiques. El juny de 2014, Huawei va anunciar que havia ajudat a establir 18 Joint Innovation Centres a Europa des de la primera iniciativa amb Vodafone l’any 2006. També ha anunciat el desenvolupament de 125 milions de lliures esterlines en el seu centre de recerca i desenvolupament a Bristol. Així mateix, llegeixo al blog Eureka! que l’anuari estadístic de l’Organització Mundial de la Propietat Intel•lectual (WIPO) corresponent a l’any 2012 situa la Xina en primer lloc en els quatre tipus de registres de la propietat intel•lectual que gestiona: patents, models d’utilitat, marques registrades i disseny industrial.

Justament, el juny passat a l’ISC14, a la fira internacional de supercomputació que té lloc a Europa, l’empresa xinesa Inspur llançava un ambiciós programa d’expansió anomenat ‘I2I’ (‘IBM to Inspur’), que té per objectiu substituir IBM com a proveïdor de servidors i supercomputadors basats en l’arquitectura estàndard de xips processadors x86.