|  | 		    
					
        
         
          
         
	
          | |  | Spørgsmål angående GEDCOMP Fra : Michael Schneiders
 | 
 Dato :  27-01-03 21:15
 | 
 |  | Hej NG.
 
 Jeg har kikket på min Gedcom fil og har lagt mærke til at Æ Ø Å er blevet
 erstattet med tegn.
 Kan det give problemer med GEDCOMP sameligning.
 
 Med Venlig Hilsen
 
 Michael Schneiders
 
 
 
 
 
 
 
 
 
 
 |  |  | 
  Lars Kr. Lundin (27-01-2003) 
 
	
          | |  | Kommentar Fra : Lars Kr. Lundin
 | 
 Dato :  27-01-03 23:02
 | 
 |  | 
 
            Mon, 27 Jan 2003 21:15:22 +0100 skrev Michael Schneiders:
 > Jeg har kikket på min Gedcom fil og har lagt mærke til at Æ Ø Å er
 > blevet erstattet med tegn.
 > Kan det give problemer med GEDCOMP sameligning.
 Det du observerer behøves ikke at være en fejl i din GEDCOM-eksport.
 Hvis du vil vide det nærmere, så vis fra starten af GEDCOM-filen
 den linje, der starter med
 1 CHAR
 samt nogle ord, der skrives med danske specialtegn.
 Hvis det skulle være en fejl, så er GEDCOMP er god til at
 håndtere forkert GEDCOM-eksporterede special-tegn.
 Send evt. filen, så skal du nok få besked om eventuelle
 problemer.
 Mvh,
 -Lars Lundin.
 -- 
 GEDCOMP: En omfattende og gratis database for slægtsforskere med
 interesse i Danmark: http://www.lklundin.dk/gedcomp/ |  |  | 
  Michael Schneiders (28-01-2003) 
 
	
          | |  | Kommentar Fra : Michael Schneiders
 | 
 Dato :  28-01-03 17:19
 | 
 |  | 
 
            Hej
 Starten af min Gedcom fil ser sådan ud.
 0 HEAD
 1 SOUR BROSKEEP
 2 VERS 6.1.11 WINDOWS
 1 DEST BROSKEEP (BROTHERS KEEPER)
 1 DATE 27 JAN 2003
 1 CHAR ANSEL
 1 FILE E:\PROGRAMMER\BROTHER'S KEEPER 6\MICHAEL\MICHAEL.GED
 1 GEDC
 2 VERS 5.5
 2 FORM LINEAGE-LINKED
 1 SUBM @SUB1@
 Hilsen
 Michael Schneiders
 "Lars Kr. Lundin" <news-gi-17@lklundin.dk> skrev i en meddelelse
 news:v%hZ9.46513$Hl6.5943727@news010.worldonline.dk...
 > Mon, 27 Jan 2003 21:15:22 +0100 skrev Michael Schneiders:
 >
 > > Jeg har kikket på min Gedcom fil og har lagt mærke til at Æ Ø Å er
 > > blevet erstattet med tegn.
 > > Kan det give problemer med GEDCOMP sameligning.
 >
 > Det du observerer behøves ikke at være en fejl i din GEDCOM-eksport.
 >
 > Hvis du vil vide det nærmere, så vis fra starten af GEDCOM-filen
 > den linje, der starter med
 > 1 CHAR
 > samt nogle ord, der skrives med danske specialtegn.
 >
 > Hvis det skulle være en fejl, så er GEDCOMP er god til at
 > håndtere forkert GEDCOM-eksporterede special-tegn.
 >
 > Send evt. filen, så skal du nok få besked om eventuelle
 > problemer.
 >
 > Mvh,
 > -Lars Lundin.
 > --
 > GEDCOMP: En omfattende og gratis database for slægtsforskere med
 > interesse i Danmark: http://www.lklundin.dk/gedcomp/ |  |  | 
   Tom Stryhn Sr. (28-01-2003) 
 
	
          | |  | Kommentar Fra : Tom Stryhn Sr.
 | 
 Dato :  28-01-03 17:59
 | 
 |  | 
 
            Prøv at skifte ANSEL ud med ANSI
 så det kommer til at se således ud
 0 HEAD
 1 SOUR BROSKEEP
 2 VERS 6.1.11 WINDOWS
 1 DEST BROSKEEP (BROTHERS KEEPER)
 1 DATE 28 JAN 2003
 1 CHAR ANSI
 1 FILE G:\xxx.GED
 1 GEDC
 2 VERS 5.5
 2 FORM LINEAGE-LINKED
 1 SUBM @SUB1@
 i BK står der også ANSI ( standard til GEDCOM )
 --
 Regards / Med venlig hilsen
 Tom Stryhn
 stryhn@email.dk
http://freepages.genealogy.rootsweb.com/~stryhn/ last update 28. Jan. 2003
 Outgoing mail is certified Virus Free.
 Checked by Norton anti-virus system
 "Michael Schneiders" <msc@adslhome.dk> wrote in message
 news:3e36ad59$0$13247$edfadb0f@dread11.news.tele.dk...
 > Hej
 >
 > Starten af min Gedcom fil ser sådan ud.
 >
 > 0 HEAD
 > 1 SOUR BROSKEEP
 >
 > 2 VERS 6.1.11 WINDOWS
 >
 > 1 DEST BROSKEEP (BROTHERS KEEPER)
 >
 > 1 DATE 27 JAN 2003
 >
 > 1 CHAR ANSEL
 >
 > 1 FILE E:\PROGRAMMER\BROTHER'S KEEPER 6\MICHAEL\MICHAEL.GED
 >
 > 1 GEDC
 >
 > 2 VERS 5.5
 >
 > 2 FORM LINEAGE-LINKED
 >
 > 1 SUBM @SUB1@
 >
 >
 >
 > Hilsen
 >
 > Michael Schneiders
 >
 >
 >
 > "Lars Kr. Lundin" <news-gi-17@lklundin.dk> skrev i en meddelelse
 > news:v%hZ9.46513$Hl6.5943727@news010.worldonline.dk...
 > > Mon, 27 Jan 2003 21:15:22 +0100 skrev Michael Schneiders:
 > >
 > > > Jeg har kikket på min Gedcom fil og har lagt mærke til at Æ Ø Å er
 > > > blevet erstattet med tegn.
 > > > Kan det give problemer med GEDCOMP sameligning.
 > >
 > > Det du observerer behøves ikke at være en fejl i din GEDCOM-eksport.
 > >
 > > Hvis du vil vide det nærmere, så vis fra starten af GEDCOM-filen
 > > den linje, der starter med
 > > 1 CHAR
 > > samt nogle ord, der skrives med danske specialtegn.
 > >
 > > Hvis det skulle være en fejl, så er GEDCOMP er god til at
 > > håndtere forkert GEDCOM-eksporterede special-tegn.
 > >
 > > Send evt. filen, så skal du nok få besked om eventuelle
 > > problemer.
 > >
 > > Mvh,
 > > -Lars Lundin.
 > > --
 > > GEDCOMP: En omfattende og gratis database for slægtsforskere med
 > > interesse i Danmark: http://www.lklundin.dk/gedcomp/ >
 >
            
             |  |  | 
    Lars Kr. Lundin (29-01-2003) 
 
	
          | |  | Kommentar Fra : Lars Kr. Lundin
 | 
 Dato :  29-01-03 02:03
 | 
 |  | 
 
            Tue, 28 Jan 2003 17:59:15 +0100 skrev Tom Stryhn Sr.:
 > Prøv at skifte ANSEL ud med ANSI
 > så det kommer til at se således ud
 > 1 CHAR ANSI
 > i BK står der også ANSI ( standard til GEDCOM )
 NEJ! Dette er endnu et punkt hvor BK ikke har
 respekt for GEDCOM-standarden.
 På
http://www.gendex.com/gedcom55/55gcch2.htm#CHARACTER_SET kan ikke-analfabeter stave sig frem til at de eneste
 gyldige tegnsæt i GEDCOM er:
  ANSEL, UNICODE og ASCII 
 hvor ANSEL er default, og hvor ASCII kun kan anvendes
 hvis GEDCOM-filen ikke indeholder specialtegn, så som
 æ, ø og å. ASCII indkodning er identisk med ANSEL,
 hvorfor ASCII er en overflødighed.
 BK har eksisteret i størrelsesordenen 10 år, og alligevel
 har forfatteren ikke formået at få en så simpel ting på
 plads. Ynkeligt.
 Når det er sagt, vil jeg tilføje at (mis)brugen af ANSI
 er ganske udbredt, og at GEDCOMP kan tolke dette tegnsæt
 korrekt.
 > "Michael Schneiders" <msc@adslhome.dk> wrote in message
 > news:3e36ad59$0$13247$edfadb0f@dread11.news.tele.dk...
 >> Hej
 >>
 >> Starten af min Gedcom fil ser sådan ud.
 >>
 >> 1 CHAR ANSEL
 Så har du været heldig/dygtig nok til at vælge en korrekt
 indkodning. Heldige såvel som dygtige mennesker skal prise
 sig lykkelige.
 Specialtegnene er i ANSEL ikke så nemme at læse (for et menneske),
 men det skal man ikke lade sig forvirre af.
 I et andet indlæg 
 Tue, 28 Jan 2003 18:49:50 +0100 skrev Tom Brøndsted:
 > Et sidespørgsmål: CHAR attributtet i mine gedcom-filer genereret af det
 > ældgamle Leister Reunion kaldes
 > 1 CHAR IBM WINDOWS
 > Dette mærkværdige udtryk dækker over ISO 8859
 Det er endnu en programmørmæssig svinestreg.
 Mens GEDCOMP også godt kan afkode denne fejl-indkodning,
 så skal man ikke regne med at det går godt i almindelige
 slægtsprogrammer.
 > Er dette den almindelige gedcom-betegnelse for ISO 8859 eller findes der
 > andre? Og hvad er nu de almindeligste karaktersæt i gedcomfiler indsendt
 > til gedcomp?
 Min respekt for programmører af slægtsprogrammer kan efterhånden
 ligge på et meget lille sted. Hvor svært kan det være ?
 I programmets GEDCOM-eksport skal man højst kunne vælge mellem
 ANSEL, UNICODE og evt. ASCII.
 Men de båt-horn, der udvikler BK, Reunion, FTW, Winfam, FamilyOrigins
 og hvad det nu ellers hedder skal åbenbart forvirre de sagesløse
 slægtsforskere (inklusive Tom & Michael) med deres helt unødvendige
 non-standard indkodning.
 Så fik jeg det på plads.
 Og så vil jeg tilføje at i et rigtigt slægtsprogram, nemlig GRAMPS,
 er indkodningen ifbm. GEDCOM-eksport som udgangspunkt ANSEL, som via
 1 enkelt knap kan ændres til UNICODE. Så simpelt kan og bør det være.
 Og så siger jeg det lige een gang til:
 Ved GEDCOM-eksport bør man anvende enten ANSEL, UNICODE (eller ASCII),
  - angivet i den foretrukne orden.
 -Lars Lundin.
 -- 
 GEDCOMP: En omfattende og gratis database for slægtsforskere med
 interesse i Danmark: http://www.lklundin.dk/gedcomp/ |  |  | 
     PC Jensen (29-01-2003) 
 
	
          | |  | Kommentar Fra : PC Jensen
 | 
 Dato :  29-01-03 10:47
 | 
 |  | 
 
            Lars Kr. Lundin wrote:
 > Tue, 28 Jan 2003 17:59:15 +0100 skrev Tom Stryhn Sr.:
 [snip]
 
 > Men de båt-horn, der udvikler BK, Reunion, FTW, Winfam, FamilyOrigins
 > og hvad det nu ellers hedder skal åbenbart forvirre de sagesløse
 > slægtsforskere (inklusive Tom & Michael) med deres helt unødvendige
 > non-standard indkodning.
 > 
 > Så fik jeg det på plads.
 :) Ellere rettere: Så fik du luft! :) Jeg vidste slet dit temperament 
 havde den dynamik, Lars.
 Selvfølgelig har du ret! Det er ganske enkelt tåbeligt og en hån mod 
 køberne at man ikke ordner en så simpel ting.
 Men hvad skal/kan de pågældende købere gøre? Det vender jeg tilbage til 
 om et øjeblik.
 Jeg har først for ganske nylig benyttet GEDCOMP og overtog en linie fra 
 en anden slægtsforskers GEDCOM-fil, som hed
 1 CHAR IBM PC
 Det er der heller ikke noget, der hedder! Og det fik jeg at vide i den 
 første fejlliste fra GEDCOMP.
 Jeg er så i den forholdsvis lykkelige situation at jeg i mange år har 
 arbejdet professionelt med databasesystemer, så jeg bruger et 
 hjemmelavet program. Det er opbygget over GEDCOM med de begrænsninger 
 der nu ligger i det. Men det gør at jeg selv kan bestemme hvordan min 
 GEDCOM-eksport foregår.
 Det tog under et kvarter at lave det sådan at "mine" specialtegn kom ud 
 i ANSEL. Jeg har ingen umlaut eller andre spidsfindigheder, kun æ, ø og 
 å. Men det svære var at finde ANSEL-standarden. Den koster åbenbart 
 penge - det er den besked man får, selv på GEDCOM-hjemmesiderne - den 
 skal købes fra American National Standards Institute.
 GENDEX, som vil være kendt af nogle for GED2HTML, har dog været så 
 flinke at lægge en gratis beskrivelse ud:
http://www.gendex.com/gedcom55/55gcappd.htm For ikke-programmører er det sin sag at dechiffrere denne side. Så her 
 følger "det lette fix" for Windowsbrugere (dog kun æ,ø,å samt umlaut):
 ----------------------------------------------
 1) Læs GEDCOM-filen ind i Notes eller Wordpad
 2) Lav linien der begynder med   1 CHAR ... om så der står:
 1 CHAR ANSEL
 3) Lav en erstat-operation for hhv. æ, ø, å, Æ, Ø og Å:
 æ erstattes med karakter nr. 181
 ø erstattes med karakter nr. 178
 å erstattes med karakter nr. 234 efterfulgt af "a" (altså to tegn)
 Æ erstattes med karakter nr. 165
 Ø erstattes med karakter nr. 162
 Å erstattes med karakter nr. 234 efterfulgt af "A" (altså to tegn)
 Når jeg giver karakternes numre i stedet for bare at skrive dem er det 
 fordi de ser forskellige ud i forskellige tegnsæt. De kan skrives fra 
 tastaturet ved at holde Alt-knappen og taste fire cifre, først et nul og 
 derefter de tre ovennævnte cifre - eksempelvis tastes karakter 181 som 
 Alt+0181 (og husk så lige at bruge "regnemaskinetasterne" til højre og 
 ikke tallene ovenover bogstaverne).
 Som standard bruger Wordpad Courier New (ændres under 
 Formatter/Skrifttype), og der ser tegnene således ud:
 æ erstattes med µ
 ø erstattes med ²
 å erstattes med êa
 Æ erstattes med ¥
 Ø erstattes med ¢
 Å erstattes med êA
 Bemærk: Du ser dog de rigtige tegn her hvis din newsreader bruger 
 Courier New.
 For at være på den sikre side: Brug ovst. tastemetode eller brug 
 Tegnoversigt til at finde frem til de rigtige erstatningstegn.
 4) Umlaut-tegn ændres på samme måde - hvis det f.eks. er u umlaut (ü) 
 ændres det til karakter 232 + bogstavet uden umlaut. Dvs.:
 ü erstattes med karakter 232 + u  - i Courier New: èu
 ö erstattes med karakter 232 + o  - i Courier New: èo
 osv.
 5) Bed en bøn for dine programleverandørers sjæle - disse 
 samvittighedsløse mennesker, som først tager dine penge og derefter 
 lader dig lave en ren slaveoperation som ovenstående. Det ville tage dem 
 max. en time at programmere det ind én gang for alle!
 ----------------------------------------------
 Jeg er en af dem der håber at den nye GEDCOM XML standard vil slå 
 igennem. Der er der frit slag for forskellige tegnsæt, idet 
 international sprogsupport allerede er indbygget i XML standarden. Men 
 "slå igennem" er et vidt begreb. De slægtsprogrammer, Lars nævner, vil 
 næppe tilbyde deres brugere denne mulighed før om en halv snes år.
 PC
 
            
             |  |  | 
      Michael Schneiders (29-01-2003) 
 
	
          | |  | Kommentar Fra : Michael Schneiders
 | 
 Dato :  29-01-03 16:51
 | 
 |  | 
 
            Hej
 Tak for svarene så vil jeg forsætte med at bruge Ansel format.
 Men jeg kan nu godt se et formål med ANSI formatet feks. hvis man bruger et
 gedcom til html program så vil der stå æøå og ikke et heller andet tegn.
 Hilsen
 Michael Schneiders
 "PC Jensen" <pc@dewa.dk> skrev i en meddelelse
 news:3E37A32F.8000205@dewa.dk...
 > Lars Kr. Lundin wrote:
 >
 > > Tue, 28 Jan 2003 17:59:15 +0100 skrev Tom Stryhn Sr.:
 >
 >
 > [snip]
 >
 >
 > > Men de båt-horn, der udvikler BK, Reunion, FTW, Winfam, FamilyOrigins
 > > og hvad det nu ellers hedder skal åbenbart forvirre de sagesløse
 > > slægtsforskere (inklusive Tom & Michael) med deres helt unødvendige
 > > non-standard indkodning.
 > >
 > > Så fik jeg det på plads.
 >
 >
 > :) Ellere rettere: Så fik du luft! :) Jeg vidste slet dit temperament
 > havde den dynamik, Lars.
 >
 > Selvfølgelig har du ret! Det er ganske enkelt tåbeligt og en hån mod
 > køberne at man ikke ordner en så simpel ting.
 >
 > Men hvad skal/kan de pågældende købere gøre? Det vender jeg tilbage til
 > om et øjeblik.
 >
 > Jeg har først for ganske nylig benyttet GEDCOMP og overtog en linie fra
 > en anden slægtsforskers GEDCOM-fil, som hed
 > 1 CHAR IBM PC
 >
 > Det er der heller ikke noget, der hedder! Og det fik jeg at vide i den
 > første fejlliste fra GEDCOMP.
 >
 > Jeg er så i den forholdsvis lykkelige situation at jeg i mange år har
 > arbejdet professionelt med databasesystemer, så jeg bruger et
 > hjemmelavet program. Det er opbygget over GEDCOM med de begrænsninger
 > der nu ligger i det. Men det gør at jeg selv kan bestemme hvordan min
 > GEDCOM-eksport foregår.
 >
 > Det tog under et kvarter at lave det sådan at "mine" specialtegn kom ud
 > i ANSEL. Jeg har ingen umlaut eller andre spidsfindigheder, kun æ, ø og
 > å. Men det svære var at finde ANSEL-standarden. Den koster åbenbart
 > penge - det er den besked man får, selv på GEDCOM-hjemmesiderne - den
 > skal købes fra American National Standards Institute.
 >
 > GENDEX, som vil være kendt af nogle for GED2HTML, har dog været så
 > flinke at lægge en gratis beskrivelse ud:
 > http://www.gendex.com/gedcom55/55gcappd.htm >
 > For ikke-programmører er det sin sag at dechiffrere denne side. Så her
 > følger "det lette fix" for Windowsbrugere (dog kun æ,ø,å samt umlaut):
 > ----------------------------------------------
 > 1) Læs GEDCOM-filen ind i Notes eller Wordpad
 >
 > 2) Lav linien der begynder med   1 CHAR ... om så der står:
 > 1 CHAR ANSEL
 >
 > 3) Lav en erstat-operation for hhv. æ, ø, å, Æ, Ø og Å:
 > æ erstattes med karakter nr. 181
 > ø erstattes med karakter nr. 178
 > å erstattes med karakter nr. 234 efterfulgt af "a" (altså to tegn)
 > Æ erstattes med karakter nr. 165
 > Ø erstattes med karakter nr. 162
 > Å erstattes med karakter nr. 234 efterfulgt af "A" (altså to tegn)
 >
 > Når jeg giver karakternes numre i stedet for bare at skrive dem er det
 > fordi de ser forskellige ud i forskellige tegnsæt. De kan skrives fra
 > tastaturet ved at holde Alt-knappen og taste fire cifre, først et nul og
 > derefter de tre ovennævnte cifre - eksempelvis tastes karakter 181 som
 > Alt+0181 (og husk så lige at bruge "regnemaskinetasterne" til højre og
 > ikke tallene ovenover bogstaverne).
 >
 > Som standard bruger Wordpad Courier New (ændres under
 > Formatter/Skrifttype), og der ser tegnene således ud:
 >
 > æ erstattes med µ
 > ø erstattes med ²
 > å erstattes med êa
 > Æ erstattes med ¥
 > Ø erstattes med ¢
 > Å erstattes med êA
 >
 > Bemærk: Du ser dog de rigtige tegn her hvis din newsreader bruger
 > Courier New.
 >
 > For at være på den sikre side: Brug ovst. tastemetode eller brug
 > Tegnoversigt til at finde frem til de rigtige erstatningstegn.
 >
 > 4) Umlaut-tegn ændres på samme måde - hvis det f.eks. er u umlaut (ü)
 > ændres det til karakter 232 + bogstavet uden umlaut. Dvs.:
 > ü erstattes med karakter 232 + u  - i Courier New: èu
 > ö erstattes med karakter 232 + o  - i Courier New: èo
 > osv.
 >
 > 5) Bed en bøn for dine programleverandørers sjæle - disse
 > samvittighedsløse mennesker, som først tager dine penge og derefter
 > lader dig lave en ren slaveoperation som ovenstående. Det ville tage dem
 > max. en time at programmere det ind én gang for alle!
 > ----------------------------------------------
 >
 > Jeg er en af dem der håber at den nye GEDCOM XML standard vil slå
 > igennem. Der er der frit slag for forskellige tegnsæt, idet
 > international sprogsupport allerede er indbygget i XML standarden. Men
 > "slå igennem" er et vidt begreb. De slægtsprogrammer, Lars nævner, vil
 > næppe tilbyde deres brugere denne mulighed før om en halv snes år.
 >
 > PC
 >
 >
 >
 >
            
             |  |  | 
       PC Jensen (29-01-2003) 
 
	
          | |  | Kommentar Fra : PC Jensen
 | 
 Dato :  29-01-03 19:44
 | 
 |  | Michael Schneiders wrote:
 
 > Tak for svarene så vil jeg forsætte med at bruge Ansel format.
 > Men jeg kan nu godt se et formål med ANSI formatet feks. hvis man bruger et
 > gedcom til html program så vil der stå æøå og ikke et heller andet tegn.
 
 Klart nok, Michael - selv om der også er forskel på gedcom->html
 programmer hvad tegnsæt angår.
 
 Men nu gjaldt altså spørgsmålet om hvad GEDCOM-standarden er, og der har
 Lars svaret - uanset hvad forskellige programmer digter sig frem til, er
 der kun: Unicode, ANSEL og ASCII - og sidstnævnte er en 7-bit standard,
 dvs. den indeholder kun 128 tegn og er derfor udelukket hvis man har
 andet end det engelske alfabet indblandet.
 
 Unicode bruger to bytes/tegn pr. bogstav og fylder derfor dobbelt så
 meget - til gengæld er det en forholdsvis moderne standard. Men det er
 alt for besværligt at omkode sin GEDCOM-fil til Unicode manuelt. ANSEL
 er et levn fra en fjern computerfortid, men skal man omkode sin
 ikke-standard GEDCOM fil i hånden til rigtig GEDCOM, er det trods alt
 det nemmeste valg.
 
 PC
 
 
 
 |  |  | 
        Lars Kr. Lundin (29-01-2003) 
 
	
          | |  | Kommentar Fra : Lars Kr. Lundin
 | 
 Dato :  29-01-03 20:53
 | 
 |  | 
 
            Wed, 29 Jan 2003 19:44:28 +0100 skrev PC Jensen:
 > Michael Schneiders wrote:
 > 
 >> Tak for svarene så vil jeg forsætte med at bruge Ansel format. Men jeg
 >> kan nu godt se et formål med ANSI formatet feks. hvis man bruger et
 >> gedcom til html program så vil der stå æøå og ikke et heller andet
 >> tegn.
 > 
 > Klart nok
 Nej, det er ikke klart, men forkert.
 En GEDCOM-til-HTML konverter skal kunne konvertere hele
 GEDCOM-standarden, inklusive ANSEL/UNICODE-tegnsæt.
 Konverteren læser altså ANSEL-tegn og skriver HTML-tegn.
 Dette må være mit sidste opgivende indlæg om tegnsæt.
 -Lars Lundin.
 -- 
 GEDCOMP: En omfattende og gratis database for slægtsforskere med
 interesse i Danmark: http://www.lklundin.dk/gedcomp/ |  |  | 
         AAFE (31-01-2003) 
 
	
          | |  | Kommentar Fra : AAFE
 | 
 Dato :  31-01-03 03:57
 | 
 |  | "Lars Kr. Lundin" <news-gi-17@lklundin.dk> skrev:
 
 > Konverteren læser altså ANSEL-tegn og skriver HTML-tegn.
 
 Hvis konverteren skal skrive HTML-tegn, og det
 mener jeg den skal, så burde den efter min mening
 skrive HTML-entities for de internationale karakterers
 vedkommende. Og det gør Gene Starks GED2HTML
 f.eks. ikke. Denne konverter skriver blot ANSI koderne,
 for de internationale karakterers vedkommende.
 
 med venlig hilsen
 Arne
 
 
 
 
 
 |  |  | 
          Arne Feldborg (31-01-2003) 
 
	
          | |  | Kommentar Fra : Arne Feldborg
 | 
 Dato :  31-01-03 08:20
 | 
 |  | 
 
            "AAFE" <intet@svar.dk> skrev Fri, 31 Jan 2003 03:57:13 +0100 
 >> Konverteren læser altså ANSEL-tegn og skriver HTML-tegn.
 >
 >Hvis konverteren skal skrive HTML-tegn, og det
 >mener jeg den skal, så burde den efter min mening
 >skrive HTML-entities for de internationale karakterers
 >vedkommende. 
 >
 Nej. Det er der absolut ingen grund til, det er faktisk endda en dårlig
 ide. ISO-Latin er standard på Internet og alle internet programmer kan
 læse det.
 HTML-entities er til for folk der sidder på systemer der ikke kan
 *skive* ISO-Latin.
 -- 
 mvh, A:\Feldborg
http://www.haunstrup.dk/feldborg/genealogi/opslag/ 
http://www.haunstrup.dk/feldborg/genealogi/download/ |  |  | 
           AAFE (31-01-2003) 
 
	
          | |  | Kommentar Fra : AAFE
 | 
 Dato :  31-01-03 11:42
 | 
 |  | 
 
            "Arne Feldborg" <feldborg@haunstrup.dk> skrev:
 > Nej. Det er der absolut ingen grund til, det er faktisk endda en dårlig
 > ide. ISO-Latin er standard på Internet og alle internet programmer kan
 > læse det.
 Det er muligt du har ret, jeg ved det ikke. Men,
 jeg ser jo, at det selv her i gruppen forekommer
 (omend sjældent), at µ bruges istedet for æ, og
 at ¢ bruges istedet for ø (for blot at nævne et par
 stykker), og der kan jeg så godt være i tvivl om,
 hvordan folk med en sådan opsætning ser vi
 andres ISO-Latin på deres skærme.
 Og for at komme ud over denne MIN tvivl, bruger
 jeg HTML-entities, på HTML-sider, idet det efter
 min opfattelse sikrer en entydig repræsentation.
 Men, i det omfang det forholder sig, som du skriver,
 at alle, verden over, ser ISO-Latin karakterer korrekt
 repræsenteret, er dette selvfølgelig mindre bøvlet
 end disse HTM-entities.
 med venlig hilsen
 Arne
 >
 > HTML-entities er til for folk der sidder på systemer der ikke kan
 > *skive* ISO-Latin.
 >
 >
 >
 > --
 > mvh, A:\Feldborg
 >
 > http://www.haunstrup.dk/feldborg/genealogi/opslag/ > http://www.haunstrup.dk/feldborg/genealogi/download/ |  |  | 
            Arne Feldborg (31-01-2003) 
 
	
          | |  | Kommentar Fra : Arne Feldborg
 | 
 Dato :  31-01-03 19:01
 | 
 |  | 
 
            "AAFE" <intet@svar.dk> skrev Fri, 31 Jan 2003 11:42:22 +0100 
 >Det er muligt du har ret, jeg ved det ikke. Men,
 >jeg ser jo, at det selv her i gruppen forekommer
 >(omend sjældent), at µ bruges istedet for æ, og
 >at ¢ bruges istedet for ø (for blot at nævne et par
 >
 Hvilket netop skyldes at den pågældende skriver fra et OS/2 system, hvor
 der er en kendt fejl den codepage der angiveligt skulle være ISO-Latin.
 -- 
 mvh, A:\Feldborg
http://www.haunstrup.dk/feldborg/genealogi/opslag/ 
http://www.haunstrup.dk/feldborg/genealogi/download/ |  |  | 
           Alf Christophersen (31-01-2003) 
 
	
          | |  | Kommentar Fra : Alf Christophersen
 | 
 Dato :  31-01-03 21:24
 | 
 |  | 
 
            On Fri, 31 Jan 2003 08:20:01 +0100, Arne Feldborg
 <feldborg@haunstrup.dk> wrote:
 >Nej. Det er der absolut ingen grund til, det er faktisk endda en dårlig
 >ide. ISO-Latin er standard på Internet og alle internet programmer kan
 >læse det.
 Forutsetter at man bruker enten Windows eller Linux, og bor i et land
 hvor 8859-1 er default. Har man 8859-2 som default vil det vises helt
 andre tegn der hvor disse er forskjellige.
 På Mac'er blir det helt andre tegn. Komplett forskjellige tegn.
 Eneste sikre er å bruke entiteter    (Så fremt ikke ønsker å
 utestenge alle med Mac eller stormaskiner med EBCDIC-tegnsett    (Det
 er vel dem som har denslags agenda i bakhodet)
            
             |  |  | 
            Arne Feldborg (01-02-2003) 
 
	
          | |  | Kommentar Fra : Arne Feldborg
 | 
 Dato :  01-02-03 08:17
 | 
 |  | 
 
            Alf Christophersen <alf.christophersen@basalmed.uio.no> skrev Fri, 31
 Jan 2003 21:23:36 +0100 
 >>Nej. Det er der absolut ingen grund til, det er faktisk endda en dårlig
 >>ide. ISO-Latin er standard på Internet og alle internet programmer kan
 >>læse det.
 >
 >Forutsetter at man bruker enten Windows eller Linux, og bor i et land
 >hvor 8859-1 er default. Har man 8859-2 som default vil det vises helt
 >andre tegn der hvor disse er forskjellige.
 >
 Nixen. Det er browseren - ikke operativsystemet - der skal (og kan) læse
 ISO-Latin
 >På Mac'er blir det helt andre tegn. Komplett forskjellige tegn.
 >
 Ikke hvis browseren følger standarden.
 >Eneste sikre er å bruke entiteter    (Så fremt ikke ønsker å
 >utestenge alle med Mac eller stormaskiner med EBCDIC-tegnsett    (Det
 >er vel dem som har denslags agenda i bakhodet)
 >
 Eneste sikre er, at hvis man *skriver* fra et system der buger et andet
 tegnsæt, så skal man bruge entities. 
 Hvis man skriver fra et system med ISO-Latin, så er der ingen grund til
 det. Udover at gøre koden mere vanskelig at læse og at få den til at
 fylde lidt mere.
 -- 
 mvh, A:\Feldborg
http://www.haunstrup.dk/feldborg/genealogi/opslag/ 
http://www.haunstrup.dk/feldborg/genealogi/download/ |  |  | 
       AAFE (31-01-2003) 
 
	
          | |  | Kommentar Fra : AAFE
 | 
 Dato :  31-01-03 03:45
 | 
 |  | "Michael Schneiders" <msc@adslhome.dk> skrev:
 
 > Men jeg kan nu godt se et formål med ANSI formatet feks. hvis man bruger
 et
 > gedcom til html program så vil der stå æøå og ikke et heller andet tegn.
 
 Hvis du bruger Gene Starks GED2HTML, kommer
 der til at stå æøå, hvad enten din GEDCOM fil så er
 i ANSI eller i ANSEL.
 
 med venlig hilsen
 Arne
 
 
 
 
 |  |  | 
      AAFE (31-01-2003) 
 
	
          | |  | Kommentar Fra : AAFE
 | 
 Dato :  31-01-03 03:43
 | 
 |  | 
 
            "PC Jensen" <pc@dewa.dk> skrev:
 >  Men det svære var at finde ANSEL-standarden. Den koster åbenbart
 > penge - det er den besked man får, selv på GEDCOM-hjemmesiderne - den
 > skal købes fra American National Standards Institute.
 Hvis du søger på Z39-47.pdf burde du kunne finde
 den frit tilgængelig på internettet. Du kan ihvertfald
 finde den her:
http://www.niso.org/standards/resources/Z39-47.pdf Du kan også finde indgangsvinklen til den her:
http://www.niso.org/standards/standard_detail.cfm?std_id=472 Hvor du enten kan købe den som hardcopy, eller nøjes
 med at tage .pdf versionen gratis    Det skal måske lige bemærkes, at dette er 1993
 udgaven, hvor GEDCOM jo refererer til 1985
 udgaven.    med venlig hilsen
 Arne
            
             |  |  | 
     Otto Jorgensen (29-01-2003) 
 
	
          | |  | Kommentar Fra : Otto Jorgensen
 | 
 Dato :  29-01-03 17:46
 | 
 |  | 
 
            Wed, 29 Jan 2003 02:02:34 +0100, in dk.videnskab.historie.genealogi,
 "Lars Kr. Lundin" <news-gi-17@lklundin.dk> wrote:
 >I programmets GEDCOM-eksport skal man højst kunne vælge mellem
 >ANSEL, UNICODE og evt. ASCII.
 Pragrammet har både ANSI, ANSEL og ASCII.
 Dette er ikke bare for å dekke nåveærende situasjon men også med tanke
 på andre program som har samme eller kun har et av disse formatene
 Når det gjelder UNICODE så er det en anbefaling og det står ikke
 spesifikk at det er et "must", Se dokumentasjonen for GEDCOM 5.5
 Men det kan legges til at ønsket om å få på plass UNICODE er fremmet for
 produsenten og kommer etterhver
 -- 
 Otto Jørgensen  
http://home.online.no/~otjoerge/
http://home.online.no/~otjoerge/bk/ All email is controlled by NORTON
            
             |  |  | 
      Lars Kr. Lundin (29-01-2003) 
 
	
          | |  | Kommentar Fra : Lars Kr. Lundin
 | 
 Dato :  29-01-03 18:25
 | 
 |  | 
 
            Wed, 29 Jan 2003 17:45:43 +0100 skrev Otto Jorgensen:
 > Wed, 29 Jan 2003 02:02:34 +0100, in dk.videnskab.historie.genealogi,
 > "Lars Kr. Lundin" <news-gi-17@lklundin.dk> wrote:
 > 
 >>I programmets GEDCOM-eksport skal man højst kunne vælge mellem ANSEL,
 >>UNICODE og evt. ASCII.
 > 
 > Når det gjelder UNICODE så er det en anbefaling og det står ikke
 > spesifikk at det er et "must",
 Bemærk nu at jeg skrev 'højst', altså at jeg netop ikke skrev at
 UNICODE er et "must".
 -Lars Lundin.
 -- 
 GEDCOMP: En omfattende og gratis database for slægtsforskere med
 interesse i Danmark: http://www.lklundin.dk/gedcomp/ |  |  | 
     Alf Christophersen (29-01-2003) 
 
	
          | |  | Kommentar Fra : Alf Christophersen
 | 
 Dato :  29-01-03 20:28
 | 
 |  | 
 
            On Wed, 29 Jan 2003 02:02:34 +0100, "Lars Kr. Lundin"
 <news-gi-17@lklundin.dk> wrote:
 > ANSEL, UNICODE og ASCII 
 >
 >hvor ANSEL er default, og hvor ASCII kun kan anvendes
 >hvis GEDCOM-filen ikke indeholder specialtegn, så som
 >æ, ø og å. ASCII indkodning er identisk med ANSEL,
 >hvorfor ASCII er en overflødighed.
 ASCII er kun et7-bits tegnsett og støtter ikke annet enn bokstavene
 A-Z samt en del tegn ellers med lavere ASCII-verdi. 8-bits tegnsett er
 mange typer standarder, derav er ANSI ett, ISO 8859-1 et annet, ANSEL
 er hveken det ene eller det annet og  kun en mormoner-standard.    ANSI er Microsoft sin versjon    |  |  | 
      Lars Kr. Lundin (29-01-2003) 
 
	
          | |  | Kommentar Fra : Lars Kr. Lundin
 | 
 Dato :  29-01-03 20:50
 | 
 |  | 
 
            Wed, 29 Jan 2003 20:28:18 +0100 skrev Alf Christophersen:
 > On Wed, 29 Jan 2003 02:02:34 +0100, "Lars Kr. Lundin"
 > <news-gi-17@lklundin.dk> wrote:
 > 
 >> ANSEL, UNICODE og ASCII
 >>
 >>hvor ANSEL er default, og hvor ASCII kun kan anvendes hvis GEDCOM-filen
 >>ikke indeholder specialtegn, så som æ, ø og å. ASCII indkodning er
 >>identisk med ANSEL, hvorfor ASCII er en overflødighed.
 > 
 > ASCII er kun et7-bits tegnsett og støtter ikke annet enn bokstavene A-Z
 > samt en del tegn ellers med lavere ASCII-verdi. 8-bits tegnsett er mange
 > typer standarder, derav er ANSI ett, ISO 8859-1 et annet, ANSEL er
 > hveken det ene eller det annet og  kun en mormoner-standard.    > 
 > ANSI er Microsoft sin versjon    Hold nu op med det sludder om tegnsæt.    Når der står ASCII i GEDCOM-standarden, så specificeres det i
 kapitel 3 om anvendelse af tegnsæt i GEDCOM, at der med ASCII
 ifbm. med GEDCOM menes 8-bits USA versionen.
 -Lars Lundin.
 -- 
 GEDCOMP: En omfattende og gratis database for slægtsforskere med
 interesse i Danmark: http://www.lklundin.dk/gedcomp/ |  |  | 
       Alf Christophersen (30-01-2003) 
 
	
          | |  | Kommentar Fra : Alf Christophersen
 | 
 Dato :  30-01-03 14:16
 | 
 |  | On Wed, 29 Jan 2003 20:49:57 +0100, "Lars Kr. Lundin"
 <news-gi-17@lklundin.dk> wrote:
 
 >ifbm. med GEDCOM menes 8-bits USA versionen.
 
 Det er det som kalles ANSI ellers i verden. ASCII er kun 7-bits
 tegnsett. Pr. definisjon. Samme hva mormonere tror. Det er mye rart de
 tror om edb til sine tider. 8-bits tegnsett USA versjon er identisk
 lik ANSI.
 
 
 |  |  | 
        Erik Helmer Nielsen (30-01-2003) 
 
	
          | |  | Kommentar Fra : Erik Helmer Nielsen
 | 
 Dato :  30-01-03 22:13
 | 
 |  | Alf Christophersen <alf.christophersen@basalmed.uio.no> skrev:
 Thu, 30 Jan 2003 14:16:05 +0100 i dk.videnskab.historie.genealogi
 
 >> ifbm. med GEDCOM menes 8-bits USA versionen. [af ASCII]
 >
 >Det er det som kalles ANSI ellers i verden.
 >8-bits tegnsett USA versjon er identisk lik ANSI.
 
 Det lyder meget interessant.
 
 Siger du hermed, at når Mormonerne skriver ASCII, så mener de i
 virkeligheden ANSI. D.v.s. at det meget omdiskuterede ANSI tegnsæt
 derved er godkendt for anvendelse i en Gedcom fil?
 
 Hvordan forklarer du så, at Mormonerne tydeligt anfører som betingelse
 for brug af ASCII, at det forudsætter 'When a language does not need
 diacritic characters..' ?
 Det 8 Bit ANSI tegnsæt overfører jo fint så alle de vigtigste af disse
 tegn i modsætning til det 7 Bit ASCII.
 
 Erik Helmer Nielsen
 
 
 
 
 
 |  |  | 
        Chris Gade Oxholm Sø~ (30-01-2003) 
 
	
          | |  | Kommentar Fra : Chris Gade Oxholm Sø~
 | 
 Dato :  30-01-03 23:12
 | 
 |  | 
 
            ASCII tegnsættet findes i en lang række under versioner (437, 850, 864, 865)
 bare for at nævne nogle få.
 ASCII tegnsættet var betinget af hvilken code page der blev indlæst og høre
 vel i grunden til fortidens DOS opsætning i opstarts filerne CONFIG.SYS og
 AUTOEXEC:BAT
 Blev/bliver dog også anvendt for Windows 95 og delvis i Windows 98 - men kun
 for DOS programmer.
 For moderne Windows versioner som ME, 2000 og XP er det reelt helt ude.
 --
 Chris Gade Oxholm Sørensen
 support@brotherskeeper.dk
 BK - software - opdatering - manual - www.brotherskeeper.dk "Alf Christophersen" <alf.christophersen@basalmed.uio.no> skrev i en
 meddelelse news:pgrg3vkamg7bqt4g3b24c54gjcab4pv3e1@4ax.com...
 > On Wed, 29 Jan 2003 20:49:57 +0100, "Lars Kr. Lundin"
 > <news-gi-17@lklundin.dk> wrote:
 >
 > >ifbm. med GEDCOM menes 8-bits USA versionen.
 >
 > Det er det som kalles ANSI ellers i verden. ASCII er kun 7-bits
 > tegnsett. Pr. definisjon. Samme hva mormonere tror. Det er mye rart de
 > tror om edb til sine tider. 8-bits tegnsett USA versjon er identisk
 > lik ANSI.
            
             |  |  | 
         Arne Feldborg (31-01-2003) 
 
	
          | |  | Kommentar Fra : Arne Feldborg
 | 
 Dato :  31-01-03 08:20
 | 
 |  | 
 
            "Chris Gade Oxholm Sørensen" <support@brotherskeeper.dk> skrev Thu, 30
 Jan 2003 23:11:47 +0100 
 >ASCII tegnsættet var betinget af hvilken code page der blev indlæst og høre
 >vel i grunden til fortidens DOS opsætning
 >
 Ikke at det har så forfærdelig meget med sagen her at gøre, men det
 stammer faktisk fra trådtelegrafien i 20'erne - hvor det såmænd afløste
 morsetabellen.
 Det skyldes alene IBMs stædighed at det overhovedet har vundet indpas i
 computerverdenen. Og som tegnsæt for udveksling af data (feks. gedcom
 filer) over landegrænser er det aldeles ubrugeligt.
 -- 
 mvh, A:\Feldborg
http://www.haunstrup.dk/feldborg/genealogi/opslag/ 
http://www.haunstrup.dk/feldborg/genealogi/download/ |  |  | 
         Erik Helmer Nielsen (31-01-2003) 
 
	
          | |  | Kommentar Fra : Erik Helmer Nielsen
 | 
 Dato :  31-01-03 13:34
 | 
 |  | 
 
            "Chris Gade Oxholm Sørensen" <support@brotherskeeper.dk> skrev:
  Thu, 30 Jan 2003 23:11:47 +0100 i dk.videnskab.historie.genealogi
 >ASCII tegnsættet findes i en lang række under versioner (437, 850, 864, 865)
 >bare for at nævne nogle få.
 Det er en lidt misvisende beskrivelse af forholdene omkring disse
 vøsentlig forskellige tegnsæt. 
 ASCII er et 7 Bit tegnsæt.
 IBM PC Codepage 437,850.. er et 8 Bit tegnsæt.
 Lad os nu ikke blive mere forvirrede end nødvendigt.
 Læs 
http://www.microsoft.com/typography/unicode/cs.htm der er der fra formodentlig autoritativ side lidt orientering om
 forskellen mellem ASCII, OEM tegnsæt som IBM PC 437/850/864, Windows
 ANSI 1252, DBCS og Unicode.
 Erik Helmer Nielsen
            
             |  |  | 
     Otto Jorgensen (29-01-2003) 
 
	
          | |  | Kommentar Fra : Otto Jorgensen
 | 
 Dato :  29-01-03 21:07
 | 
 |  | 
 
            Wed, 29 Jan 2003 02:02:34 +0100, in dk.videnskab.historie.genealogi,
 "Lars Kr. Lundin" <news-gi-17@lklundin.dk> wrote:
 >BK har eksisteret i størrelsesordenen 10 år, og alligevel
 >har forfatteren ikke formået at få en så simpel ting på
 >plads. Ynkeligt.
 Første versjonene av BK var i DOS versjon og da eksisterte ikke GEDCOM
 5.5 :=))
 Hva du synes er ynkeligt sier mer om deg enn om programmet. Produsenten
 tar også hensyn til de ulike brukergruppene og ASCII er ikke det samme
 overalt. dette vil avhenge meget etter hvilken CODE-page brukerne har
 brukt til sine DOS-versjoner av BK.
 At UNICODE ikke er på plass, er beklagelig, men det er ikke et krav om
 at det skal være på plass, sett med den tekst som kom til GEDCOM5.5
 -- 
 Otto Jørgensen  
http://home.online.no/~otjoerge/
http://home.online.no/~otjoerge/bk/ All email is controlled by NORTON
            
             |  |  | 
      Erik Helmer Nielsen (29-01-2003) 
 
	
          | |  | Kommentar Fra : Erik Helmer Nielsen
 | 
 Dato :  29-01-03 23:27
 | 
 |  | Otto Jorgensen <otjoerge@online.no> skrev:
 Wed, 29 Jan 2003 21:07:23 +0100 i dk.videnskab.historie.genealogi
 
 >"Lars Kr. Lundin" <news-gi-17@lklundin.dk> wrote:
 >>BK har eksisteret i størrelsesordenen 10 år, og alligevel
 >>har forfatteren ikke formået at få en så simpel ting på
 >>plads. Ynkeligt.
 
 Otto Jørgensen svarer:
 >Første versjonene av BK var i DOS versjon og da eksisterte ikke GEDCOM
 >5.5 :=))
 
 Begge dele er selvfølgelig i sig selv korrekt, men det er bare totalt
 irrelevant. Det er ikke noget reelt svar og det bevirker kun at at
 læsernes opmærksomhed bliver afledet fra det væsentlige.
 
 I mit eksemplar af Gedcom vers. 5.1 af 18 sept 1992 (mere end 10 år
 gammel) står der:
 "Only one character set is currently defined.  It accommodates the set
 of Latin-based languages, as explained below.
 8-Bit ANSEL--The GEDCOM Default Character Set.
 The 8-Bit ANSEL (American National Standard for Extended Latin
 Alphabet Coded Character Set for Bibliographic Use, Z39.47, 1985
 copyright) is the default character set for GEDCOM.
 "
 
 >..............ASCII er ikke det samme
 >overalt. dette vil avhenge meget etter hvilken CODE-page brukerne har
 >brukt til sine DOS-versjoner av BK.
 Dette er en misvisende eller misforstået sammenblanding af ASCII og
 IBM's Codepage systemer og det fjerner også debatten fra det
 væsentlige.
 
 Erik Helmer Nielsen
 
 
 
 |  |  | 
       Otto Jorgensen (30-01-2003) 
 
	
          | |  | Kommentar Fra : Otto Jorgensen
 | 
 Dato :  30-01-03 00:08
 | 
 |  | 
 
            Wed, 29 Jan 2003 23:26:55 +0100, in dk.videnskab.historie.genealogi,
 Erik Helmer Nielsen <ehelmer@boerne.dk> wrote:
 >Otto Jorgensen <otjoerge@online.no> skrev:
 > Wed, 29 Jan 2003 21:07:23 +0100 i dk.videnskab.historie.genealogi
 >
 >>"Lars Kr. Lundin" <news-gi-17@lklundin.dk> wrote:
 >>>BK har eksisteret i størrelsesordenen 10 år, og alligevel
 >>>har forfatteren ikke formået at få en så simpel ting på
 >>>plads. Ynkeligt.
 >
 >Otto Jørgensen svarer:
 >>Første versjonene av BK var i DOS versjon og da eksisterte ikke GEDCOM
 >>5.5 :=))
 >
 >Begge dele er selvfølgelig i sig selv korrekt, men det er bare totalt
 >irrelevant. Det er ikke noget reelt svar og det bevirker kun at at
 >læsernes opmærksomhed bliver afledet fra det væsentlige.
 Og hva er det vesentlig; at  brukerne kan bruke GEDCOM til å kommunisere
 med hverandre og at brukere som har ANSI, ASCII; ANSEL eller UNICODE
 skal kunne kommunisere.
 Det er ikke noe i dokumentasjonen som sier at man kan har mer enn
 standard. Det er også et ønske at UNICODE skal innføres, men det er det
 ikke.
 Dette tilsvarer alle de programversjoner som i tillegg til GEDCOM 5.5
 også kan levere andre formater av GEDCOM!"
 Er det feil at man har noe mer på enkelte områder?
 >I mit eksemplar af Gedcom vers. 5.1 af 18 sept 1992 (mere end 10 år
 >gammel) står der:
 GEDCOM5.1 er Draft og ikke noe gyldig dokument. I serien 5.* finnes kun
 en gyldig versjon og det er 5.5
 -- 
 Otto Jørgensen  
http://home.online.no/~otjoerge/
http://home.online.no/~otjoerge/bk/ All email is controlled by NORTON
            
             |  |  | 
     AAFE (31-01-2003) 
 
	
          | |  | Kommentar Fra : AAFE
 | 
 Dato :  31-01-03 03:28
 | 
 |  | 
 
            "Lars Kr. Lundin" <news-gi-17@lklundin.dk> skrev:
 > NEJ! Dette er endnu et punkt hvor BK ikke har
 > respekt for GEDCOM-standarden.
 Er det ikke at rette smed for bager?
 I BKW (engelsk) står der:
 Character in gedcom file
 o DOS
 o Windows
 o Ansel (Normal for gedcom)
 I BKW (dansk) derimod, står der:
 Tegnsæt i GEDCOM fil
 o ASCII (Tegntabel 437)
 o ANSI (Standard til GEDCOM)
 o ANSEL
 I begge tilfælde er ANSEL valgt som default.
 Det forekommer mig således, at det ikke er BK, som
 sådan, der ikke har respekt for GEDCOM-standarden.
 Men at det snarere er den danske oversættelse, der
 ikke har respekt for GEDCOM-standarden, og altså
 heller ikke har respekt for det engelsksprogede
 udgangspunkt    > På
 > http://www.gendex.com/gedcom55/55gcch2.htm#CHARACTER_SET > kan ikke-analfabeter stave sig frem til at de eneste
 > gyldige tegnsæt i GEDCOM er:
 >
 >  ANSEL, UNICODE og ASCII
 Man kan også være pragmatisk at se således på
 det, at BK har tilpasset sig virkelighedens verden,
 og altså generer ANSEL som default, og derudover
 tilbydes der to andre muligheder, der ganske vist
 ikke er standard GEDCOM, men som måske kan
 være brugbare i visse sammenhænge.
 [nej, jeg kan ikke uddybe, hvilke "visse" sammenhænge
 det kan være, for jeg aner det ikke    ]
 > BK har eksisteret i størrelsesordenen 10 år, og alligevel
 > har forfatteren ikke formået at få en så simpel ting på
 > plads. Ynkeligt.
 Med fare for at gentage mig selv, retter du så ikke
 bager for smed? Når nu Ansel er valgt som default
 og der i BKW (engelsk) står:
 Character in gedcom file
 o DOS
 o Windows
 o Ansel (Normal for gedcom)
 med venlig hilsen
 Arne
            
             |  |  | 
      Arne Feldborg (31-01-2003) 
 
	
          | |  | Kommentar Fra : Arne Feldborg
 | 
 Dato :  31-01-03 08:20
 | 
 |  | 
 
            "AAFE" <intet@svar.dk> skrev Fri, 31 Jan 2003 03:28:20 +0100 
 >Det forekommer mig således, at det ikke er BK, som
 >sådan, der ikke har respekt for GEDCOM-standarden.
 >Men at det snarere er den danske oversættelse, der
 >ikke har respekt for GEDCOM-standarden, og altså
 >heller ikke har respekt for det engelsksprogede
 >udgangspunkt    >
 Og når der så henvises til CodePage 437 (hvilket jo i sig selv er
 korrekt), så burde der stå med meget store bogstaver at det kun er til
 brug i engelsksprogede lande. Og kun hvis man ikke påtænker at sende
 data ud af disse områder.
 Og hvor mange danskere er mon i den situation.?
 -- 
 mvh, A:\Feldborg
http://www.haunstrup.dk/feldborg/genealogi/opslag/ 
http://www.haunstrup.dk/feldborg/genealogi/download/ |  |  | 
       Alf Christophersen (31-01-2003) 
 
	
          | |  | Kommentar Fra : Alf Christophersen
 | 
 Dato :  31-01-03 18:05
 | 
 |  | 
 
            On Fri, 31 Jan 2003 08:20:02 +0100, Arne Feldborg
 <feldborg@haunstrup.dk> wrote:
 >Og når der så henvises til CodePage 437 (hvilket jo i sig selv er
 >korrekt), så burde der stå med meget store bogstaver at det kun er til
 >brug i engelsksprogede lande. Og kun hvis man ikke påtænker at sende
 >data ud af disse områder.
 Den eneste forskjell mellom 437 og 865 er yen og centimes i stedet for
 stor og liten ø    Mellom 850 og 437 eller 865 er det derimot store forskjeller.
            
             |  |  | 
        Arne Feldborg (01-02-2003) 
 
	
          | |  | Kommentar Fra : Arne Feldborg
 | 
 Dato :  01-02-03 08:17
 | 
 |  | 
 
            Alf Christophersen <alf.christophersen@basalmed.uio.no> skrev Fri, 31
 Jan 2003 18:05:26 +0100 
 >>Og når der så henvises til CodePage 437 (hvilket jo i sig selv er
 >>korrekt), så burde der stå med meget store bogstaver at det kun er til
 >>brug i engelsksprogede lande. Og kun hvis man ikke påtænker at sende
 >>data ud af disse områder.
 >
 >Den eneste forskjell mellom 437 og 865 er yen og centimes i stedet for
 >stor og liten ø    >
 Både ja og nej. I 437 eksisterer ø og Ø overhovedet ikke og derfor er
 den ubrugelig i Skandinavien. Og derfor er det næsten også altid de to
 bogstaver der er mest bøvl med - også kendt som IBM's 'lille ø' problem.
 >Mellom 850 og 437 eller 865 er det derimot store forskjeller.
 >
 Men til gengæld ligger alle de skandinaviske tegn og alle omlydene på de
 samme pladser i 850 og 865, og det må være det interessante i den her
 forbindelse.
 Det er vel næppe heller uden grund at de er navngivet henholdsvis USA
 (437), Multilingual (850) og Nordisk (865). 
 -- 
 mvh, A:\Feldborg
http://www.haunstrup.dk/feldborg/genealogi/opslag/ 
http://www.haunstrup.dk/feldborg/genealogi/download/ |  |  | 
  Tom Brøndsted (28-01-2003) 
 
	
          | |  | Kommentar Fra : Tom Brøndsted
 | 
 Dato :  28-01-03 18:50
 | 
 |  | 
 
 "Lars Kr. Lundin" wrote:Hvis du vil vide det nærmere, så vis fra starten
 af GEDCOM-filen
 
 > den linje, der starter med
 > 1 CHAR
 > samt nogle ord, der skrives med danske specialtegn.
 >
 
 Et sidespørgsmål: CHAR attributtet i mine gedcom-filer genereret af det
 ældgamle Leister Reunion kaldes
 1 CHAR IBM WINDOWS
 Dette mærkværdige udtryk dækker over ISO 8859
 
 Er dette den almindelige gedcom-betegnelse for ISO 8859 eller findes der
 andre? Og hvad er nu de almindeligste karaktersæt i gedcomfiler indsendt
 til gedcomp?
 
 mvh tom brøndsted
 
 
 
 
 |  |  | 
   Alf Christophersen (29-01-2003) 
 
	
          | |  | Kommentar Fra : Alf Christophersen
 | 
 Dato :  29-01-03 13:15
 | 
 |  | On Tue, 28 Jan 2003 18:49:50 +0100, Tom Brøndsted <tom@brondsted.dk>
 wrote:
 
 >ældgamle Leister Reunion kaldes
 >1 CHAR IBM WINDOWS
 >Dette mærkværdige udtryk dækker over ISO 8859
 >
 >Er dette den almindelige gedcom-betegnelse for ISO 8859 eller findes der
 >andre? Og hvad er nu de almindeligste karaktersæt i gedcomfiler indsendt
 >til gedcomp?
 
 Det er nok mer korrekt kalt ANSI. Det er for alle praktiske formål
 identisk med ISO 8859, men skal være utvidet i forhold til det i og
 med det også innbefatter noen utvidete tegn (to-tegns tegnsett)
 
 
 |  |  | 
    Lars Kr. Lundin (29-01-2003) 
 
	
          | |  | Kommentar Fra : Lars Kr. Lundin
 | 
 Dato :  29-01-03 14:29
 | 
 |  | 
 
            Wed, 29 Jan 2003 13:14:39 +0100 skrev Alf Christophersen:
 > On Tue, 28 Jan 2003 18:49:50 +0100, Tom Brøndsted <tom@brondsted.dk>
 > wrote:
 >> Og hvad er nu de almindeligste karaktersæt i gedcomfiler indsendt
 >>til gedcomp?
 > 
 Jeg fik aldrig svaret på det spørgsmål. Svaret er ANSEL.
 > Det er nok mer korrekt kalt ANSI. Det er for alle praktiske formål
 > identisk med ISO 8859, men skal være utvidet i forhold til det i og med
 > det også innbefatter noen utvidete tegn (to-tegns tegnsett)
 ANSI og ISO 8859 er ukendte begreber i GEDCOM-standarden.
 -Lars Lundin.
 -- 
 GEDCOMP: En omfattende og gratis database for slægtsforskere med
 interesse i Danmark: http://www.lklundin.dk/gedcomp/ |  |  | 
     Alf Christophersen (30-01-2003) 
 
	
          | |  | Kommentar Fra : Alf Christophersen
 | 
 Dato :  30-01-03 00:58
 | 
 |  | On Wed, 29 Jan 2003 14:29:27 +0100, "Lars Kr. Lundin"
 <news-gi-17@lklundin.dk> wrote:
 
 >ANSI og ISO 8859 er ukendte begreber i GEDCOM-standarden.
 
 Mer korrekt er at de gikk ut i 5.5-standarden. ANSI er nevnt
 tidligere, sammen med IBM DOS tegnsett som gikk ut fordi det var
 codepage avhengig. Ant. fordi de som laget standarden ikke visste
 forskjell mellom DOS og ANSI, gikk også ANSI ut med samme begrunnelse
 av at det var nasjonsspesifikt, noe det strengt tatt ikke er,men med
 unntak av to uinteressante tegn, yen og centimes.
 
 
 |  |  | 
      Erik Helmer Nielsen (30-01-2003) 
 
	
          | |  | Kommentar Fra : Erik Helmer Nielsen
 | 
 Dato :  30-01-03 14:39
 | 
 |  | Alf Christophersen <alf.christophersen@basalmed.uio.no> skrev:
 Thu, 30 Jan 2003 00:57:30 +0100 i dk.videnskab.historie.genealogi
 
 >>ANSI og ISO 8859 er ukendte begreber i GEDCOM-standarden.
 >
 >Mer korrekt er at de gikk ut i 5.5-standarden.
 
 Det stemmer ikke helt med hvad jeg kan læse.
 
 I mit eksemplar af Gedcom vers. 5.1 af 18 sept 1992 (mere end 10 år
 gammel) står der:
 "Only one character set is currently defined.  It accommodates the set
 of Latin-based languages, as explained below.
 8-Bit ANSEL--The GEDCOM Default Character Set."
 
 Nu kan du selvfølgelig hævde at alle versioner af Gedcom 5 før 5.5
 rent formelt blev udsendt som Draft, men det ændrer dog ikke ved den
 kendsgerning at forfatterne allerede for mere end 10 år siden
 anbefalede ANSEL og kun ANSEL som tegnsæt for Gedcom.
 
 Erik Helmer Nielsen
 
 
 
 |  |  | 
       Alf Christophersen (30-01-2003) 
 
	
          | |  | Kommentar Fra : Alf Christophersen
 | 
 Dato :  30-01-03 21:00
 | 
 |  | On Thu, 30 Jan 2003 14:38:55 +0100, Erik Helmer Nielsen
 <ehelmer@boerne.dk> wrote:
 
 >Nu kan du selvfølgelig hævde at alle versioner af Gedcom 5 før 5.5
 >rent formelt blev udsendt som Draft, men det ændrer dog ikke ved den
 >kendsgerning at forfatterne allerede for mere end 10 år siden
 >anbefalede ANSEL og kun ANSEL som tegnsæt for Gedcom.
 
 standarden inntil løsslipping av 5.5 var 4.0.
 
 
 |  |  | 
 |  |