DatamaskinerFiltyper

CSV-format, eller hvor du skal sette komma?

Blant programmene, møtte om ikke en programmerer, er det allerede en avansert bruker, importere data fra ett program til et annet ikke skjer veldig sjelden. Og ganske ofte er det nødvendig å importere tabelldata, som faktisk ble skapt av formatet CSV. Hvem utviklet flere alternative løsninger (XML leder blant dem). Men etableringen av CSV-filen, i noen tilfeller, er den mest praktiske løsningen, og noen - det mest problematiske.

Det står for navnet på det formatet som en commaseparatedvalues - kommadelte verdier. I Notisblokk-fil som følger:

00, 01, 02, 03;

01, 15, 34, 11;

16, 27, 33, 06 (ved slutten av et tegn sette ikke påkrevd)

Og i et Excel-regneark eller lignende program allerede så:

00 01 02 03
01 15 34 11
16 27 33 06

Men nå diskuterte vi det enkleste tilfellet. Problemene begynner bare på grunn av det faktum at på grunn av svært komprimerte datarapportering, CSV-format brukes til å overføre store mengder informasjon. Oftest funnet i databasene til ulike verdier: numerisk, alfanumerisk, alpha, med mellomrom, etc. Ofte i store matriser er feil, og hvis, for eksempel, et sted vil være en ekstra komma i innholdet av ett av feltene, kan alle cellene bli fortrengt av en.

Vanligvis oppstår problemer når data importeres via filformatet CSV, kan deles inn i tre kategorier:

1 - Feil fyllings felt.

2 - Feil datakonvertering ved lagring i CSV-fil.

3 - Feil gjenkjenningsprogrammet format importør.

Det første tilfellet har vi delvis undersøkt. For å bekjempe problemet, må du gi et middel for å overvåke riktigheten av de opplysninger som er registrert. For eksempel, hvis du trenger å samle en database over adresser for e-postlisten, er det spesielle skript som bekrefter om en person har kommet inn i e-post i riktig format. Der det er hull, komma og andre data som kan leses feil, innholdet i feltet må i anførselstegn (såkalt datamaskin "").

Det andre tilfellet er forbundet med valget av koding. Trenger du å finne ut er ofte oppleves av hvilken koding foretrekker å importere program. I Windows brukte i 1251, så hvis den opprinnelige filen vil møte teksten til Unicode, følger det vil bli vist i et annet program som en kjede av spørsmål. I Excel, kan du lagre i CSV-format med ulik koding og skilletegn (bortsett fra det punktet fortsatt i kategorien bruk, og semikolon), men det er best å lage en fil i Notepad ++ eller OpenOffice.org Calc.

Det tredje tilfelle - en konsekvens av den andre. Historisk sett har CSV-formatet ikke har en enkel standard. Mange programmer blir oppfattet som CSV og TSV fil (tabulator-) og SCSV (atskilt med semikolon), spesielt fordi filtypen ikke er rapportert om det. I dette tilfellet blir data lest feil og er ikke fordelt blant cellene i riktig rekkefølge. Det beste vi kan gi råd - for å skape en CSV-fil personlig. Som allerede nevnt, det er behov for å dra nytte av en praktisk editor.

Triks hvordan å temme CSV-format, kjente programmerere. Enkelt brukeren må følge våre anbefalinger for å lage en fil. Minst av alle problemene oppstår når filen er laget spesielt for import til et bestemt program (og noen ganger på en annen måte). Det er lettere å ta hensyn til alle mulige problemene i data.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 no.atomiyme.com. Theme powered by WordPress.