Dataförlust vid filkopiering?

Diskussioner kring teknikens utveckling genom tiderna och dess inverkan på vår historia.
Användarvisningsbild
Widsith
Medlem
Inlägg: 1376
Blev medlem: 18 juli 2003, 14:26
Ort: Uddevalla

Inlägg av Widsith » 3 mars 2006, 09:42

Hexmaster skrev:Men i vår datavärld har vi inte sådana problem. Format som FAT och NTFS, ASCII och JPEG, med flera, är synnerligen väldokumenterade. Har man data som filer så kan man enkelt säkerhetskopiera, och göra fräscha kopior med jämna mellanrum.
Jag har för mig att Zip-diskar skall vara ett förhållandevis hållbart lagringsmedia. Har jag rätt, Hexenmeister?

Användarvisningsbild
Hexmaster
Saknad medlem †
Inlägg: 10194
Blev medlem: 12 juni 2004, 18:41
Ort: Tjörn
Kontakt:

Inlägg av Hexmaster » 3 mars 2006, 10:40

Har man en gammal Zip-skiva som man verkligen vill läsa så är det inga större problem att hitta en sådan drive - finns trots allt lite varstans (inkl. hos undertecknad). Ett kassettband till en ABC80 eller en åtta tums flexskiva är knepigare.

Men har man data på nätet så är de tekniska detaljerna mindre viktiga, den främsta poängen är att vi har väldokumenterade filformat.

Sen så kan man ju konstatera, att vi vet väldigt mycket om åtminstone aspekter av ex.vis romartiden, trots att originalskrifterna gått förlorade för mycket länge sedan. Original är bäst, men kopior fungerar, och i digitala sammanhang finns ju ingen skillnad.

Lertavlorna med kilskrift är ett bra exempel - fast kanske inte - har för mig att de som bevarats är de som bränts, vilket ofta berodde på att arkiven brunnit snarare än medveten konservering.
Men en bränd lertavla i en öken är kanske den bästa lagringen man hittills kommit fram till; de kan se så fräscha ut som brändes de i förra veckan. Hålkort i bränd lera kanske vore något? Eller CD-skivor som håller - förresten är ju CD-skivor också en sorts hålkort.

Användarvisningsbild
Widsith
Medlem
Inlägg: 1376
Blev medlem: 18 juli 2003, 14:26
Ort: Uddevalla

Inlägg av Widsith » 3 mars 2006, 12:08

Hexmaster skrev:Har man en gammal Zip-skiva som man verkligen vill läsa så är det inga större problem att hitta en sådan drive - finns trots allt lite varstans (inkl. hos undertecknad). Ett kassettband till en ABC80 eller en åtta tums flexskiva är knepigare.
Det var inte riktigt vad jag tänkte på, utan mer ett mediums förmåga att behålla informationen. Men tittar man på problemen med att bevara information till eftervärlden så rör det sig just kring detta: Det som överför informationen, mediet, måste vara så hållbart att informationen bevaras för lång tid. Sättet att lagra informationen, eller filformatet som du säger, måste vara lika känt för den framtide historikern som det är för den nutide arkivarien. Och informationen måste vara lätt att återvinna, även om teknologin förändras.
Original är bäst, men kopior fungerar, och i digitala sammanhang finns ju ingen skillnad.
Ingen kopia är exakt likadan som originalet, det kan gälla en avskriven årbok där kopisten pillar in ordet folkungar, eller den förlust i data som sker varje gång en digitaliserad bild kopieras. Kopior kan utge sig själva för att vara exakta kopior av originalet men som när originalet återfinns visar sig innehålla omtolkningar och inskrivningar.

Hällristningar och grottmålningar uppfyller märkligt nog på många sätt kraven på ett "långtidsminne", kanske skulle man återgå till det filformatet? I bergrum då, för att undvika luftföroreningar.
Eller CD-skivor som håller - förresten är ju CD-skivor också en sorts hålkort
Holodiskar behöver inte hålla för att kunna överföra information - och är också ett slags hålkort. Se mitt inlägg ovan.

Användarvisningsbild
Hexmaster
Saknad medlem †
Inlägg: 10194
Blev medlem: 12 juni 2004, 18:41
Ort: Tjörn
Kontakt:

Inlägg av Hexmaster » 3 mars 2006, 13:56

Betr. "långtidsminnen" så är det ju så, att vi kan se det som bevarats, men inte resten. Ser man bara till Döda havs-rullarna så är det en utmärkt idé att lägga papyrus-rullar (är det väl?) i krukor i en grotta nånstans, men tänker man efter inser man nackdelar...
Widsith skrev:Det var inte riktigt vad jag tänkte på, utan mer ett mediums förmåga att behålla informationen.
Magnetism känns över huvud taget riskabelt. Lite för nyckfullt och känsligt.
Widsith skrev:Sättet att lagra informationen, eller filformatet som du säger, måste vara lika känt för den framtide historikern som det är för den nutide arkivarien.
Eller åtminstone möjligt att rekonstruera. I DDR-fallet, där man inte ens känner till filstrukturen (som är mer grundläggande än filformat) så är "variabel-rymden" så stor att det känns hopplöst att ens börja. Som en Rosette-sten i tusen bitar, eller nåt.
Widsith skrev:
Original är bäst, men kopior fungerar, och i digitala sammanhang finns ju ingen skillnad.
Ingen kopia är exakt likadan som originalet, det kan gälla en avskriven årbok där kopisten pillar in ordet folkungar, eller den förlust i data som sker varje gång en digitaliserad bild kopieras. Kopior kan utge sig själva för att vara exakta kopior av originalet men som när originalet återfinns visar sig innehålla omtolkningar och inskrivningar.
Digitala kopior är exakt likadana som originalet - annars skulle ex.vis "Digital Rights Management" inte vara någon stor fråga :) . Exemplet med bilden du nämner, är det måhända en sammanblandning med det faktum att ex.vis JPEG är ett "förstörande" format, bilden blir alltså lite sämre varje gång man gör om processen. Men det är en helt annan sak än en vanligt kopia rätt av.

Användarvisningsbild
Widsith
Medlem
Inlägg: 1376
Blev medlem: 18 juli 2003, 14:26
Ort: Uddevalla

Inlägg av Widsith » 3 mars 2006, 14:22

Hexmaster skrev:
Widsith skrev:
Original är bäst, men kopior fungerar, och i digitala sammanhang finns ju ingen skillnad.
Ingen kopia är exakt likadan som originalet, det kan gälla en avskriven årbok där kopisten pillar in ordet folkungar, eller den förlust i data som sker varje gång en digitaliserad bild kopieras. Kopior kan utge sig själva för att vara exakta kopior av originalet men som när originalet återfinns visar sig innehålla omtolkningar och inskrivningar.
Digitala kopior är exakt likadana som originalet - annars skulle ex.vis "Digital Rights Management" inte vara någon stor fråga :) . Exemplet med bilden du nämner, är det måhända en sammanblandning med det faktum att ex.vis JPEG är ett "förstörande" format, bilden blir alltså lite sämre varje gång man gör om processen. Men det är en helt annan sak än en vanligt kopia rätt av.
I teorin är det så att digitala kopior är likadana som originalet. Kikar man dock närmare på bits och bytes uppkommer vid kopiering något som kallas för "Digital Generation loss". Sök på Google... :)

Användarvisningsbild
Hexmaster
Saknad medlem †
Inlägg: 10194
Blev medlem: 12 juni 2004, 18:41
Ort: Tjörn
Kontakt:

Inlägg av Hexmaster » 3 mars 2006, 14:33

Widsith skrev:I teorin är det så att digitala kopior är likadana som originalet. Kikar man dock närmare på bits och bytes uppkommer vid kopiering något som kallas för "Digital Generation loss". Sök på Google... :)
?? Hittade Wikipedias artikel om "Generation loss", där den digitala varianten omnämns såsom något som i praktiken inte existerar:
Copying a digital file gives an exact copy if the equipment is operating properly.
(...)
...copying a digital file as-is, without decompression and recompression, even if it is in a lossy format, incurs no generation loss ? the copied file is identical to the original.
http://en.wikipedia.org/wiki/Generation_loss

"Lossy" = JPEG och MP3, där man minskar filstorleken genom att "förenkla" bilden/låten så finurligt att det helst inte märks alls. Upprepas förfarandet så märks det dock tydligt nog.
"Lossless" = Utan förluster; man kan ta Bibeln, komprimera den till en zip-fil och sedan packa upp den igen, utan att tappa bort ett jota.

Jag vidhåller att datafiler kan kopieras helt utan förluster av något slag.

Användarvisningsbild
Widsith
Medlem
Inlägg: 1376
Blev medlem: 18 juli 2003, 14:26
Ort: Uddevalla

Inlägg av Widsith » 3 mars 2006, 15:29

Hexmaster skrev:Jag vidhåller att datafiler kan kopieras helt utan förluster av något slag.
Och jag vidhåller att det finns grader även i helvetet. Mellan "Lossy" och "Lossless" finns sådana spännande bekantskaper som "Virtually Lossless" och "Near-Lossless", båda välkända storheter för entusiasten. Tyvärr dras ofta direkta paralleller mellan dessa och "Lossless". I själva verket är en helt "Lossless" överföring av data beroende av närvaron av en ideal utrustning, vilket aldrig är fallet. Därav min anmärkning: "i teorin".

Här är en intressant artikel i ämnet livskraftig information: Ensuring the Longevity of Digital Information.
http://www.clir.org/pubs/archives/ensuring.pdf
Senast redigerad av 1 Widsith, redigerad totalt 3 gånger.

Användarvisningsbild
Hexmaster
Saknad medlem †
Inlägg: 10194
Blev medlem: 12 juni 2004, 18:41
Ort: Tjörn
Kontakt:

Inlägg av Hexmaster » 3 mars 2006, 15:33

OK, men ditt tips att googla "Digital generation loss" gav bl.a. som resultat en artikel vari dess principiella icke-existens förklaras, så jag undrar fortfarande vad du menar...

Sen så är allt om "lossy" och "lossless" ett helt annat ämne. Förvisso intressant, men irrelevant.

Användarvisningsbild
Widsith
Medlem
Inlägg: 1376
Blev medlem: 18 juli 2003, 14:26
Ort: Uddevalla

Inlägg av Widsith » 3 mars 2006, 15:43

Hexmaster skrev: Sen så är allt om "lossy" och "lossless" ett helt annat ämne. Förvisso intressant, men irrelevant.
Tråden handlar om överförande av information till framtiden, och du hävdade att en digital kopia är exakt likadan som originalet, så på vad sätt är det irrelevant?
OK, men ditt tips att googla "Digital generation loss" gav bl.a. som resultat en artikel vari dess principiella icke-existens förklaras, så jag undrar fortfarande vad du menar...
Vilken artikel menar du? Den i Wikipedia? Där läser jag:
Careful planning of an audio or imaging signal chain from beginning to end and rearranging to minimize multiple conversions is important. Often, arbitrary choices of numbers of pixels and sampling rates for source, destination, and intermediates can seriously degrade digital signals in spite of the potential of digital technology for eliminating generation loss completely.
Där talas enbart om en potential hos den digitala tekniken att eliminera generationsförluster, inte att generationsförluster inte existerar.
Senast redigerad av 1 Widsith, redigerad totalt 3 gånger.

Användarvisningsbild
Hexmaster
Saknad medlem †
Inlägg: 10194
Blev medlem: 12 juni 2004, 18:41
Ort: Tjörn
Kontakt:

Inlägg av Hexmaster » 3 mars 2006, 15:53

Widsith skrev:Tråden handlar om överförande av information till framtiden, och du hävdade att en digital kopia är exakt likadan som originalet, så på vad sätt är det irrelevant?
Därför att "lossy/lossless" är något som händer när man skapar en bild som JPEG, eller ljud som MP3. Man kan sedan kopiera någon av dessa filer, eller vilka andra filer som helst, i miljoner generationer utan att något tappas bort.
Widsith skrev:
OK, men ditt tips att googla "Digital generation loss" gav bl.a. som resultat en artikel vari dess principiella icke-existens förklaras, så jag undrar fortfarande vad du menar...
Vilken artikel menar du? Den i Wikipedia?
Ja. PDF:en du tipsade om verkade inte heller innehålla något om "Digital generation loss".

Användarvisningsbild
Widsith
Medlem
Inlägg: 1376
Blev medlem: 18 juli 2003, 14:26
Ort: Uddevalla

Inlägg av Widsith » 3 mars 2006, 15:57

Hexmaster skrev:Därför att "lossy/lossless" är något som händer när man skapar en bild som JPEG, eller ljud som MP3. Man kan sedan kopiera någon av dessa filer, eller vilka andra filer som helst, i miljoner generationer utan att något tappas bort.
Nej, poängen är att det inte bara handlar om uppenbara förluster som i JPEG eller MP3, utan om något som förekommer i all digital kopiering.
Hexmaster skrev:
Widsith skrev:
Hexmaster skrev:OK, men ditt tips att googla "Digital generation loss" gav bl.a. som resultat en artikel vari dess principiella icke-existens förklaras, så jag undrar fortfarande vad du menar...
Vilken artikel menar du? Den i Wikipedia?
Ja.
Se ovan. Hann tyvärr inte göra redigeringen innan ditt nästa inlägg.

Henke
Medlem
Inlägg: 1226
Blev medlem: 25 september 2003, 18:27
Ort: Stockholm

Inlägg av Henke » 3 mars 2006, 16:04

Widsith skrev:
Hexmaster skrev:Därför att "lossy/lossless" är något som händer när man skapar en bild som JPEG, eller ljud som MP3. Man kan sedan kopiera någon av dessa filer, eller vilka andra filer som helst, i miljoner generationer utan att något tappas bort.
Nej, poängen är att det inte bara handlar om uppenbara förluster som i JPEG eller MP3, utan om något som förekommer i all digital kopiering.
Att information går förlorad när man går från analogt till digitalt format är helt klart. Likaså kan det ske om man konverterar en fil från ett digitalt format till ett annat.

Menar du att det även skulle ske vid en vanlig filkopiering?

Henrik

Användarvisningsbild
Widsith
Medlem
Inlägg: 1376
Blev medlem: 18 juli 2003, 14:26
Ort: Uddevalla

Inlägg av Widsith » 3 mars 2006, 16:12

Henke skrev:Menar du att det även skulle ske vid en vanlig filkopiering?
Yes.
Hexmaster skrev:PDF:en du tipsade om verkade inte heller innehålla något om "Digital generation loss".
Länken till PDF:en tog jag med då den uppenbart hade med ämnet att göra, vilket jag också sade:
Här är en intressant artikel i ämnet livskraftig information: Ensuring the Longevity of Digital Information.
http://www.clir.org/pubs/archives/ensuring.pdf

Användarvisningsbild
Hexmaster
Saknad medlem †
Inlägg: 10194
Blev medlem: 12 juni 2004, 18:41
Ort: Tjörn
Kontakt:

Inlägg av Hexmaster » 3 mars 2006, 16:21

Widsith skrev:
Henke skrev:Menar du att det även skulle ske vid en vanlig filkopiering?
Yes.
Väntar fortfarande på några källor till detta märkvärdiga påstående - tess dess får det ligga på undantagshyllan.

Användarvisningsbild
Widsith
Medlem
Inlägg: 1376
Blev medlem: 18 juli 2003, 14:26
Ort: Uddevalla

Inlägg av Widsith » 3 mars 2006, 16:53

Hexmaster skrev:
Widsith skrev:
Henke skrev:Menar du att det även skulle ske vid en vanlig filkopiering?
Yes.
Väntar fortfarande på några källor till detta märkvärdiga påstående - tess dess får det ligga på undantagshyllan.
:) I själva verket är det såhär, Hexmaster: Varje filkopiering innebär risk för filkorruption. Hårresande men sant. Därför tillämpas vid varje kopiering av data en kontroll av originalfil och den fil som skapats genom kopieringen för att se till att kopian är likadan som originalet, en så kallad Cyclic Redundancy Check, CRC (Kan du säkert läsa om på Wikipedia). Men CRC är inte perfekt, sålunda finns det en rad saker som kan skilja sig mellan original och kopia, och dessutom mäts inte om originalet blivit korrumperat genom kopieringen, och därmed identisk med kopian. En korruption av kopian sker alltid, och ännu mer så om kopieringen sker under stark belastning av datorns resurser, eller nätverkets resurser, eller om kopieringen sker från CD till dator till CD, den sistnämnda kopieringen med stark relevans för ämnet då detta är den kopiering som är mest tänkbar om vi som nu fortsätter kopiera våra gamla CD-skivor.
Kopian är alltså korrupt till en viss grad när vi lagt den i vår tidskapsel-CD, och när det en gång är dags att kopiera den på nytt sker en ytterligare korruption av data, och så vidare tills en gång toleransnivån för dessa små additioner och subtraktioner till och från filinnehållet har överskridits, och vi inte längre kan läsa filen.

Här är förresten en länk till artikeln på Wikipedia :wink:
http://en.wikipedia.org/wiki/Cyclic_redundancy_check

Skriv svar