tirsdag 27. januar 2009

Faren med dårlige ingresser i biografier

Biografiartikler bør stort sett alltid begynn på denne formen: «Arne B. Carlsen (født 1. januar 1953) er en norsk forretningsmann og tidligere politiker (KrF). Han har siden 2005 ledet IT-selskapet IKT-Oppland, og er også kjent fra tiden som generalsekretær i KrF fra 1990 til 1998». Variasjoner av dette er selvsagt greit («... er en norsk KrF-politiker og forretingsmann ...», «... er en norsk IT-leder, forretningsmann og politiker (KrF) ...», etc.), men poenget er altså at innledningen skal oppsummere i én eller to setninger hva han er kjent for, og det med et litt lenger perspektiv enn bare et par år.

Hvis biografiartikler hopper rett på med for ny informasjon blir det vanskeligere å vedlikeholde dem og og de blir fort stygge over tid. For eksempel begynner mange fotballspillerartikler slik:
«Stephen T. Uphorn (født 1. januar 1980)» spiller på Liverpool i Premier League. Han er spiss, og ble kjøpt av Benitez i 2005 fra Brimingham. Han har også spilt i Cambridge United.»
Et åpenbart problem med denne innledningen er selvsagt at leseren ikke fortår hvilket yrke Uphorn har dersom han ikke vet at det er et fotballag som heter Liverpool som spiller i en serie kjent som Premier League. Et annet problem er at det absolutt ikke er umulig at det finnes et lag som heter Liverpool som spiller i en «Premier League» i en annen idrett, så en slik ingress skaper også potensielt tvetydigheter. (Nå er det neppe sannsynlig at innebandylaget Liverpool også har en manager som heter Benitez, men vi kan uansett ikke forevente at leserne har full oversikt over hvem som er lagledere for alle mulige lag i alle mulige idretter).

Så var det dette med vedlikeholdbarhet: Sett nå at Uphorn blir solgt til Juventus. En velmenende sjel endrer nå på innledningen, slik at den ser slik ut:

«Stephen T. Uphorn (født 1. januar 1980)» spilte på Liverpool i Premier League fram til 2009. Han er spiss, og ble kjøpt til Liverpool av Benitez i 2005 fra Brimingham. Han har også spilt i Cambridge United. Nå spiller han på Juventus i Italia.»

Nå kommer altså den viktige informasjonen i fjerde setning, etter ting som egentlig er mindre viktig. Dette er faktisk noe jeg ser rett som det er i fotballspillerartikler.

Sett nå om artikkelen opprinnelig heller begynte slik:

«Stephen T. Uphorn (født 1. januar 1980) er en irsk fotballspiller. Han spiller for den engelske Premier League-klubben Liverpool, noe han har gjort siden 2005. Uphorn er spiss, og spilte tidligere for Birmingham og Cambridge United»
Nå blir artikkelen mye enklere å vedlikeholde! En som vil oppdatere med ny klubb bytter ut «engelske Premier League-klubben Liverpool» med «italienske Serie A-klubben Juventus», «2005» med «2009», og legger til «Liverpool» før «Birmingham».

Sen obervante leser vil sikkert påpeke at det ikke er vanskelig å skrive om den første eksempel-innledningen på en bedre måte, og at det selvsagt er mulig å omskrive det andre eksempelet til «... er en irsk fotballspiller. Han spilte for den engelske Premier League-klubben Liverpool, men er nå i italienske Juventus» og lignende, mindre gode eksempler. Men jeg tror likevel det er slik at stramme ingresser har en tendens til å holde seg stramme, mens de som først har begynt å flyte ut ofte bare blir verre.

Grunnen til at jeg kom på dette nå var at jeg akkurat så en oppdatering av artikkelen om Terje Osmundsen. Osmundsen har tydelig skiftet jobb, og artikkelen gikk da fra «Terje Osmundsen (født 1. februar 1957) er redaktør og gründer for tidsskriftet Mandag Morgen, som ble etablert i 2003» til «Terje Osmundsen (født 1. februar 1957) var redaktør og gründer for tidsskriftet Mandag Morgen fra 2003 til 2009.». Osmundsens nye jobb, som er oppgitt til å være i selskapet Scatec Solar, ble bare nevnt sist i artikkelen. Min spådom er at om artikkelen hadde begynt med «Terje Osmundsen (født 1. februar 1957) er en norsk næringslivsleder og tidligere politiker (H). Han har blant annet være Unge Høyre-leder, og er nå redaktør i tidsskriftet Mandag Morgen» ville oppdateringen (gjort av en ny bruker) heller blitt til noe à la det langt bedre «Terje Osmundsen (født 1. februar 1957) er en norsk næringslivsleder og tidligere politiker (H). Han har blant annet være Unge Høyre-leder, og jobber nå i selskapet Scatec Solar».

torsdag 22. januar 2009

Britannica på nett - hvorfor er Wikipedia mer populært?

I en artikkel i Sidney Moring Herald forteller daglig leder i Britannica, Jorge Cauz, om at også Britannica skal åpne for brukerbidrag. Hr. Cruz uttalte også at han reagerer på at Google konsekvent rangerer Wikipedia høyere enn Britannica.

Saken ble tatt opp på den populære nettsiden Slashdot, der det var flere gode kommentarer fra leserne. Jeg gjengir her noen jeg synes var spesielt innsiktsfulle:

  • Wikipedia is ranked higher because it is more linked throughout the web. But this is just another example where PageRank really is working: it's returning results that are most useful to the searcher. For instance for "neutron" on Google, the first link is to Wikipedia. Britannica is nowhere on the first page. If you go directly to Britannica, they do indeed have an article on "neutron". However, it is a "premium topic" and keeps asking me to become a member. So when someone is searching for information about neutrons, what source is more useful: the one that immediately provides some information, with references; or the one that asks you to pay some money (or try the free trial...) in order to get full access, so that you can then figure out whether the information they have is useful or not... ? The fact is that Wikipedia is more heavily linked because it is a more accessible, therefore more useful, source of information. Even if Britannica's content were superior, this would still be the case. The fact that Wikipedia is more expansive, more timely, and frequently more detailed/referenced than Britannica just makes the choice even clearer. PageRank works. Wikipedia is overall a more useful source to the average web surfer, and thus deserves a much higher rank. [lenke tilbake til innlegget]
Kommentaren over illustrerer kjernen i poenget. Hvis en ressurs (Britannica) krever penger for å bli lest, er det ingen som gidder å betale for det om alternativet (Wikipedia) er nesten like bra. Og når gratis-alternativet faktisk er bedre er Britannica i praksis bankerott.

  • I finally did find a Britannica entry on Cherenkov Radiation, featuring all of a paragraph of info and no pictures (had to use Google, not Britannica's own search engine, to find it). Now, compare that to the Wikipedia entry. And they WONDER why Wikipedia's articles rank higher?!?! [lenke tilbake til innlegget]
Det er vel ingen som påstår det at Wikipedias søke-fuksjon er spesielt mye å skryte av, men den er utrolig mye bedre enn Britannica sin. Det sier alt om de tekniske løsningene Britannica har valgt. I dette tilfellet er Wikipedias artikkel både mye bedre, og mye lettere å finne. Det sier alt.

  • If it [Britannica] was free instead of being a subscription based service, it might be more popular. It's an inescapable fact of economics. All other things being roughly equal, a free alternative will beat one that costs money... And for what "people" want, Wikipedia and Britannica are essentially equal. No one's looking for exhaustive scientific research on a subject. They're looking for the atomic number of Tin, or how many eggs a chicken lays per week. Who the fuck is going to pay $70 a year for that? [lenke tilbake til innlegget]
Helt enig (selv om jeg selv ville ha unngått bruken av ordet «fuck»)

  • Just looking at Britannica.com's home page will reveal why they aren't ranked as well as Wikipedia. Upwards of 90% of the home page content is irrelevant to the majority of users, who are there because they want to look something up, not look at the video of the day, play with the "Featured" flash movie, or read about how Britannica is involved in Advocacy for Animals. This is an excellent example of web design molded around the needs of internal customers and requirements rather than the needs of the end user. The flash movies swoop in as they load, drawing attention away from the user's goal: the search box in the upper-middle of the screen, which itself is visually subservient to the arrogant "Premium Membership - Free Trial" button in the upper-right. Both google and wikipedia did it right. Give the user a search box, a logo, and some language options. Trust them to explore your system on their own. [lenke tilbake til innlegget]

Wikipedias brukergrensesnitt er ikke perfekt, men det fungerer til formålet: Folk kan enkelt søke på det de er interessert i. Britannicas brukergrensesnitt er hva jeg vil karakterisere som søppel.

  • One of the biggest problems with Wikipedia's reliability is that it's unreasonably difficult to cite references, so people don't; which means there's a liberal policy where you don't have to add references, which leads to most people thinking they don't have to do so, that "someone will come along and fix it later". I'm not saying it's super-hard to cite references, just that it very time consuming to work out the syntax and formatting for the citation tag, and then wonder why nothing shows up when you're previewing. And that's only if you can find the method-du-jour for doing so, given that there are sixty million different ways of adding references. Reference citing is a hack on top of the engine that should be part of the core functionality. [lenke tilbake til innlegget]

Et veldig godt poeng. Det å referere til kilder en av tingene der MediaWiki-programvaren har størst forbedringspotensiale.

Det burde ikke være så vanskelig å få ordnet dette. Men: I fjor vår tok jeg kurset INF5180 - Produkt- og prosessforbedring innen systemutvikling ved Universitetet i Oslo, der jeg brukte mye tid på å se på hvordan utviklingen av MediaWiki foregikk fra første gang en interessent (engelsk: «stakeholder») foreslo ett nytt funksjonelt krav til kravet var realisert og rullet ut i programvaren i bruk på Wikipedia. Denne prosessen virket svært tilfeldig, for å si det mildt, så det er ikke grunn til å være optimistisk.

  • It's the plethora of sources in the Wikipedia articles that are most valuable. I know the Wikipedia article is a cobbled together opinion that might be worthless and even wrong. So what? I can read the cited sources and form my own opinion, an option which Britannica doesn't really offer. They think they are their own authority and that their readers can end their investigation there because of the high quality. Sorry, that's stupid. Real research doesn't work that way. The days of "proof by authority" are rapidly fading. "[Citation needed]" is the way that real science has always worked, and most other subjects. You figure it out for yourself by reviewing what has already been done, and you back up your claims. It isn't perfect, but it is much better than no citations or "because we're Britannica!" [lenke tilbake til innlegget]
Dette er noe jeg hører veldig ofte fra folk som ikke selv er aktive wiki-skribenter, men som er ivrige lesere. Referanser er noe av det som gjør Wikipedia så bra! Jeg kan virkelig ikke forstå de brukerne som mener at referanser av en aller annen grunn ikke er nødvendig i Wikipedia. Om referanser brukes aktivt, der det kommer klart frem hvem det er som mener hva, kan leserne selv vurdere informasjonens troverdighet og en eventuell bias i kilden. Det kan ikke Britannica eller SNL oppnå på samme måte når de implisitt sier «stol på oss, vi vet hva vi snakker om» og ikke oppgir referanser.

tirsdag 20. januar 2009

Nye biografier

I dag har jeg skrevet et tre nye biografier: Signe Horn, Svein Larsen og Karin Holmsen. På tross av at de tre artiklene ikke er så alt for lange tok de svært lang tid å skrive; Larsen-artikkelen alene tok over to timer.

Dette er personer der det ikke finnes noen gode biografier på nett eller artikler på andre Wikipedia-språk man kan basere nonb.wiki-artiklene på. For å skrive artiklene må jeg da søke i Atekst, og lete meg gjennom hundrevis av avisartikler. Det tar lang tid, men gir jo stort sett bra resultater der praktisk talt alle opplysninger er referansebelagte. Og det bør de jo være i en artikler om nålevende personer! Det at det faktisk finnes flere hundre treff på disse personene i Atekst viser jo også klart at de er «notable» / inklusjonsverdige / hva man nå vil kalle det.

Wikipedia er ofte plaget av «recentism», altså at hendelser og personer fra den siste tiden blir fremhevet. Derfor synes jeg det er viktig at vi får artikler om politikere og forretningsmenn som var aktive på 80- og 90-tallet. Det er også viktig at artiklene ikke bruker unødvendig mye plass på ting som har skjedd helt nylig - for eksempel utlot jeg bevisst å nevne «Der Untergang»-klippet i Larsen-artikkelen. Hvorfor? Fordi han har vært sentral i Oslopolitikken og radiobransjen i snart 30 år, og akkurat denne hendelsen utgjør en ubetydelig del av hans virke. Larsen er kjent for rollen i Arbeiderpartiet på åttitallet og for P4 på nittitallet, ikke et filmklipp fra 2008 (selv om det må sies at det neppe var spesielt lurt av Larsen å sende en video til Kulturdepartementet der ledende folk i radiobransjen sammenlignes med Hitler og andre toppnazister).

fredag 9. januar 2009

Leif A. Wellerop - hvem er egentlig han?

I forbindelse med mediafokuset på Israel og opptøyene i Oslo i går tenkte jeg å skrive en artikkel om Leif A. Wellerop, en av dem som holdt en appell i gårsdagens pro-israelske markering. Wellerop er et navn som stadig går igjen i pressen (spesielt den kristne delen) når det er snakk om den norske pro-israelske bevegelsen, så han er en person Wikipedia bør ha en artikkel om.

Jeg regner meg selv om en relativt god googler, men akkurat her måtte jeg gi opp. Jeg kom faktisk ikke lengre enn til «'''Leif Andreas Wellerop''' (født [[30. mai]] [[1939]]) er en [[Norge|norsk]] ...» - noe jeg fant i skattelistene (hva skulle Wikipedia-skribenter gjort uten Stavanger Aftenblads skattesøk anno 2001?). Jeg finner mange steder på nett at han er daglig leder (eller direktør) i den norske avdelingen av Kristne Ambassade Jerusalem, men der stopper det. Verdensveven ser ut til å være kjemisk renset for mer utfyllende opplysninger om Wellerop (og «Leif Andreas Wellerop (født 30. mai 1939) er leder for den norske avdelingen av Kristne Ambassade Jerusalem. {{stubb|biografi}} [[Kategori:Nordmenn]][[Kategori:fødsler i 1939]]» er «litt» for tynt til en WP-artikkel).

Dette irriterer meg litt, mulig jeg skal grave litt mer etter opplysninger i løpet av helgen.