|
|
 | XML parsing og ÆØÅ problemer Fra : Jacob Mogensen |
Dato : 24-11-03 08:43 |
|
Når jeg parser et XML feed med indholdet "Danskudviklet overvågningsværktøj"
får jeg efterfølgende givet "Danskudviklet overvÃ¥gningsværktøj".
Jeg bruger følgende:
$xml_parser = xml_parser_create();
xml_parser_set_option($xml_parser, XML_OPTION_CASE_FOLDING, true);
xml_set_element_handler($xml_parser, "startElement", "endElement");
xml_set_character_data_handler($xml_parser, "characterData");
if (!($fp = fopen($file, "r"))) {
die("could not open XML input");
}
while ($data = fread($fp, 7000)) {
if (!xml_parse($xml_parser, $data, feof($fp))) {
die(sprintf("XML error: %s at line %d",
xml_error_string(xml_get_error_code($xml_parser)),
xml_get_current_line_number($xml_parser)));
}
}
characterData($parser, $data) gør ikke andet end at sætte $data ind i en
query, og det er så i denne query, at ÆØÅ kommer til at se mærkelige ud.
Nogen der kender til en løsning?
MVH
Jacob
| |
Peter Brodersen (24-11-2003)
 | Kommentar Fra : Peter Brodersen |
Dato : 24-11-03 23:14 |
|
On Mon, 24 Nov 2003 08:43:05 +0100, "Jacob Mogensen"
<jacob@gratis-ting.dk> wrote:
>Når jeg parser et XML feed med indholdet "Danskudviklet overvågningsværktøj"
>får jeg efterfølgende givet "Danskudviklet overvÃ¥gningsværktøj".
XML er pr. default i UTF-8-format. Det vil en XML-reader sandsynligvis
også acceptere. Derfor er din data blevet konverteret korrekt til
UTF-8.
--
- Peter Brodersen
Ugens sprogtip: :) (og ikke *sxms*)
| |
Jacob Mogensen (25-11-2003)
 | Kommentar Fra : Jacob Mogensen |
Dato : 25-11-03 18:34 |
|
Jeg fik nu løst problemet. Tak for hjælpen.
"Peter Brodersen" <usenet@ter.dk> skrev i en meddelelse
news:bptvp7$mlo$1@dknews.tiscali.dk...
> On Mon, 24 Nov 2003 08:43:05 +0100, "Jacob Mogensen"
> <jacob@gratis-ting.dk> wrote:
>
> >Når jeg parser et XML feed med indholdet "Danskudviklet
overvågningsværktøj"
> >får jeg efterfølgende givet "Danskudviklet overvÃ¥gningsværktøj".
>
> XML er pr. default i UTF-8-format. Det vil en XML-reader sandsynligvis
> også acceptere. Derfor er din data blevet konverteret korrekt til
> UTF-8.
>
> --
> - Peter Brodersen
>
> Ugens sprogtip: :) (og ikke *sxms*)
| |
|
|