Odstráňte duplikáty v stĺpci Excel. Odstráňte duplikáty v Exceli. Podmienené formátovanie v Exceli

Keď vyvstane úloha optimalizovať databázu alebo sa zmení jej štruktúra, niekedy sa vyskytne vedľajšia úloha usporiadať už nahromadené údaje. Je dobré, ak sa tabuľka už pri vývoji dostala do normálnej podoby a celý systém je organizovaný tak, aby sa v ňom nehromadili zbytočné duplicitné informácie. Ak to tak nie je, potom sa pri finalizácii takéhoto systému chcete zbaviť všetkých nadbytočných dát a robiť všetko v najvyššej kvalite.

V tomto článku zvážime úlohu odstránenia duplicitných riadkov v databázovej tabuľke. Okamžite poznamenávam, že hovoríme o potrebe odstrániť presne duplicitné riadky. Napríklad záznamy v tabuľke objednávok s poľami „kód objednávky“, „kód produktu“, „kód zákazníka“, „dátum objednávky“ sa môžu líšiť iba v kóde objednávky, keďže jeden zákazník si môže na stránke objednať ten istý produkt viackrát. ten istý deň, raz. A hlavným ukazovateľom, že všetko je v poriadku, je prítomnosť kľúčového poľa.

Ak vidíme tabuľku preplnenú duplicitnými poľami bez toho, aby bola explicitná potreba každého záznamu, potom je to presne to, čo by sa malo opraviť.

Príklad jasne redundantnej tabuľky:

Teraz sa pozrime, ako môžeme tento problém vyriešiť. Tu je možné použiť niekoľko metód.


1. Môžete napísať funkciu na porovnanie a opakovanie všetkých údajov. Je to dlhá doba a nie vždy chcete písať kód na jednorazové použitie.


2. Ďalším riešením je vytvoriť výberový dotaz so zoskupením údajov, aby sa vrátili iba jedinečné riadky:

SELECT country_id, city_name
Z mytable
GROUP BY country_id, city_name

Získame nasledujúcu vzorku:

Potom sa výsledný súbor údajov zapíše do inej tabuľky.


3. Tieto riešenia používajú dodatočný kód alebo dodatočné tabuľky. Pohodlnejšie by však bolo robiť všetko len pomocou SQL dotazov bez ďalších tabuliek. A tu je príklad takéhoto riešenia:

DELETE a.* Z mytable a,
(VYBERTE

Z mýtnej tabuľky b

) c
KDE
a.country_id = c.country_id
AND a.city_name = c.city_name
AND a.id > c.mid

Po vykonaní takéhoto dotazu zostanú v tabuľke iba jedinečné záznamy:

Teraz sa pozrime bližšie na to, ako to celé funguje. Pri žiadosti o vymazanie musíte zadať podmienku, ktorá špecifikuje, ktoré údaje sa majú vymazať a ktoré ponechať. Musíme odstrániť všetky nejedinečné položky. Tie. ak existuje niekoľko identických záznamov (sú rovnaké, ak majú rovnaké hodnoty country_id a city_name), potom musíte zobrať jeden z riadkov, zapamätať si jeho kód a vymazať všetky záznamy s rovnakými hodnotami country_id a city_name, ale odlišným kód (id).

Reťazec dotazu SQL:

DELETE a.* Z mytable a,

určuje, že odstránenie sa vykoná z tabuľky mytable.

Výberový dotaz potom vygeneruje pomocnú tabuľku, v ktorej zoskupíme záznamy tak, aby boli všetky záznamy jedinečné:

(VYBERTE
b.country_id, b.city_name, MIN(b.id) mid
Z mýtnej tabuľky b
GROUP BY b.country_id, b.city_name
) c

MIN(b.id) mid - vygeneruje stredový stĺpec (skratka min id), ktorý obsahuje minimálnu hodnotu id v každej podskupine.

Výsledkom je tabuľka obsahujúca jedinečné záznamy a id prvého riadku pre každú skupinu duplicitných záznamov.

Teraz máme dva stoly. Jeden všeobecný obsahujúci všetky záznamy. Budú z nej odstránené nadbytočné riadky. Druhá obsahuje informácie o riadkoch, ktoré sa majú uložiť.

Zostáva len vytvoriť podmienku, kde je uvedené: musíte vymazať všetky riadky, v ktorých sa polia country_id a city_name zhodujú, ale id sa nezhoduje. V tomto prípade je vybratá minimálna hodnota id, takže všetky záznamy, ktorých id je väčšie ako to, ktoré je vybraté v dočasnej tabuľke, sa vymažú.


Treba tiež poznamenať, že opísaná operácia môže byť vykonaná, ak je v tabuľke kľúčové pole. Ak sa zrazu objaví tabuľka bez jedinečného identifikátora, stačí ju pridať:

ALTER TABLE ` mytable` ADD `id` INT(11) NOT NULL AUTO_INCREMENT , PRIDAŤ PRIMÁRNY KĽÚČ (`id`)

Vykonaním takéhoto dotazu získame ďalší stĺpec vyplnený jedinečnými číselnými hodnotami pre každý riadok tabuľky.

Vykonávame všetky potrebné úkony. Po dokončení operácie na vymazanie tabuľky od duplicitných záznamov je možné toto pole tiež vymazať.

Pri práci s programom Microsoft Excel často nastáva situácia, keď je potrebné odstrániť duplicitné riadky. Tento proces sa môže stať nezmyselnou, monotónnou a časovo náročnou prácou, existuje však množstvo spôsobov, ako si túto úlohu zjednodušiť. Dnes sa pozrieme na niekoľko praktických metód na vyhľadanie a odstránenie duplicitných riadkov v Exceli. Vezmime si ako príklad nasledujúcu tabuľku údajov:

Možnosť 1: Odstrániť duplikáty príkazu v Exceli

Microsoft Excel má vstavaný nástroj, ktorý vám umožňuje nájsť a odstrániť duplicitné riadky. Začnime hľadaním duplicitných riadkov. Ak to chcete urobiť, vyberte ľubovoľnú bunku v tabuľke a potom kliknutím vyberte celú tabuľku Ctrl+A.

Prejdite na kartu Dátum(Údaje) a potom stlačte príkaz Odstrániť duplikáty(Odstrániť duplikáty), ako je uvedené nižšie.

Zobrazí sa malé dialógové okno Odstrániť duplikáty(Odstráňte duplikáty). Môžete si všimnúť, že výber prvého riadku sa automaticky odstráni. Dôvodom je začiarkavacie políčko nastavené v odseku Moje údaje majú hlavičky(Moje údaje obsahujú hlavičky).

V našom príklade nie sú žiadne hlavičky, pretože tabuľka začína na 1. riadku. Zrušme teda začiarknutie políčka. Týmto spôsobom si všimnete, že sa znova vyberie celá tabuľka a sekcia stĺpci(Stĺpce) sa zmení z duplikovať na Stĺpec A, B a S.

Teraz, keď je vybratá celá tabuľka, kliknite OK na odstránenie duplikátov. V našom prípade sa vymažú všetky riadky s duplicitnými údajmi okrem jedného. Všetky informácie o odstránení sa zobrazia v kontextovom dialógovom okne.

Možnosť 2: Rozšírený filter

Druhým nástrojom Excelu, pomocou ktorého môžete nájsť a odstrániť duplikáty, je Pokročilý filter. Táto metóda platí aj pre Excel 2003. Ak chcete použiť filter, musíte vybrať celú tabuľku, ako predtým, pomocou klávesovej skratky Ctrl+A.

Potom prejdite na kartu Údaje(Údaje), v skupine príkazov Triediť a filtrovať(Sort & Filter) kliknite na príkaz Pokročilé(Voliteľné), ako je uvedené nižšie. Ak používate Excel 2003, zavolajte na rozbaľovaciu ponuku Údaje(Údaje), vyberte Filtre(Filtre) a potom pokročilé filtre(Pokročilé filtre).

Teraz musíte začiarknuť políčko Len jedinečné záznamy(Len jedinečné položky).

Po stlačení OK všetky duplikáty v dokumente budú odstránené, okrem jedného záznamu. V našom príklade zostali dva záznamy, pretože prvý duplikát bol nájdený v riadku 1. Táto metóda automaticky určí hlavičky v tabuľke. Ak chcete odstrániť prvý riadok, budete ho musieť odstrániť ručne. Ak má 1. riadok hlavičky a nie duplikáty, zostane iba jedna kópia existujúcich opakovaní.

Možnosť 3: Výmena

Táto metóda je užitočná, keď potrebujete nájsť duplicitné riadky v malých tabuľkách. Použijeme nástroj Nájsť a nahradiť(Search and Replace), ktorý je zabudovaný do všetkých produktov Microsoft Office. Najprv musíte otvoriť tabuľku Excel, s ktorou chcete pracovať.

Pri otvorenej tabuľke vyberte bunku, ktorej obsah chcete nájsť a nahradiť, a skopírujte ju. Ak to chcete urobiť, vyberte požadovanú bunku a stlačte klávesovú skratku ctrl+c.

Po skopírovaní slova, ktoré chcete nájsť, použite kombináciu ctrl+h zobrazíte dialógové okno Nájsť a nahradiť(Vyhľadať a nahradiť). Prilepte skopírované slovo z poľa Nájsť stlačením ctrl+v.

Kliknite na tlačidlo možnosti(Možnosti), aby ste otvorili ďalší zoznam možností. Začiarknite políčko vedľa Porovnajte obsah celej bunky(Celá bunka). Toto sa musí urobiť, pretože v niektorých bunkách sa hľadané slová nachádzajú spolu s inými slovami. Ak túto možnosť nevyberiete, môžete neúmyselne vymazať bunky, ktoré si chcete ponechať. Uistite sa, že všetky ostatné nastavenia sa zhodujú s tými, ktoré sú zobrazené na obrázku nižšie.

Teraz musíte do poľa zadať hodnotu Nahradiť s(Nahradené). V tomto príklade použijeme číslo 1 . Po zadaní požadovanej hodnoty stlačte Nahradiť všetko(Nahradiť všetko).

Je vidieť, že všetky hodnoty duplikát v bunkách tabuľky budú nahradené 1 . Použili sme hodnotu 1 , pretože je malý a v texte vyčnieva. Teraz môžete vizuálne identifikovať riadky, ktoré majú duplicitné hodnoty.

Ak chcete ponechať jeden z duplikátov, jednoducho prilepte pôvodný text späť do riadku, ktorý bol nahradený. V našom prípade obnovíme hodnoty v 1. riadku tabuľky.

Keď identifikujete riadky s opakujúcim sa obsahom, vyberte ich jeden po druhom podržaním tlačidla ctrl.

Po označení všetkých riadkov, ktoré chcete odstrániť, kliknite pravým tlačidlom myši na záhlavie ktoréhokoľvek z vybratých riadkov a v kontextovej ponuke kliknite na Odstrániť(Vymazať). Nestláčajte kláves Odstrániť na klávesnici, pretože v tomto prípade sa vymaže iba obsah buniek a nie celý riadok.

Týmto spôsobom si môžete všimnúť, že všetky zostávajúce riadky majú jedinečné hodnoty.

Ahoj všetkým! Niektorí mi teraz budú rozumieť a niektorí nie (ktorí s textom tak často nepracujú). Vo všeobecnosti často pracujem s dokumentmi a vždy mám otázku, ako odstrániť duplicitné riadky ...

Dvojky sú všade, napríklad pri množstve programov. A na vymazanie rovnakých textových riadkov existuje len málo programov. Áno, vôbec neexistujú! Koľko som teraz nehľadal, ukážem 2 programy, pomocou ktorých to môžete urobiť. A potom sa zdá, že jeden je napísaný sám, od autora, ktorému tiež došla trpezlivosť ich hľadať)))

1 spôsob. Ako odstrániť duplicitné riadky v Exceli

Táto metóda bude prvá, pretože. tento program si inštaluje väčšina používateľov. Je súčasťou balíka Microsoft Office. Otvorte Excel a vložte text, ktorý chcete zoradiť.

Váš textový stĺpec by mal byť teraz zvýraznený. Keď ho vyberiete, kliknite na Odstrániť duplikáty.

Zobrazí sa okno, v ktorom vyberieme požadovaný stĺpec. A kliknite na tlačidlo OK.

Zobrazí sa okno so správou o odstránení duplikátov.

Všetko, vidíme, že duplikáty boli odstránené.

2 spôsoby, ako odstrániť duplicitné riadky

Na pomoc príde program, ktorý som videl čisto náhodou. Mimochodom, nielen táto funkcionalita je v ňom implementovaná. Možno to niekto využije na iný účel. Sťahuje sa...

Konkrétne som napísal niekoľko rovnakých a duplicitných riadkov.

Spustíme program. Vyberieme odstránenie duplikátov a tlačidlo vyberieme a odstránime duplikáty. Vyberte svoj súbor.

Možnosti funkcií automatickej tabuľky vám umožňujú porovnávať hodnoty a eliminovať ich duplikáty. Hneď je potrebné poznamenať, že rovnaké číselné hodnoty s rôznymi formátmi buniek v Exceli sú vnímané ako odlišné. Zvážte toto pravidlo na konkrétnom príklade pri odstraňovaní duplikátov.

Ako odstrániť duplikáty v Exceli

Na obrázku nižšie je tabuľka s duplicitnými hodnotami. Riadok 3 obsahuje rovnakú hodnotu ako riadok 6. A hodnota riadka 4 = riadok 7. Bunky s číslami v duplicitných riadkoch majú rovnakú hodnotu a rôzne formáty. Za desatinnou čiarkou majú iný počet číslic. Vykonajte 2 rôzne operácie na odstránenie duplikátov.

Odstránenie duplikátov na základe hodnôt stĺpcov s textom:


Riadky 6 a 7 sa rozpoznajú ako duplikáty a odstránia sa z tabuľky. Ak v kroku 2 nezakážete kontrolu podľa stĺpca, žiadny riadok sa neodstráni, pretože pre Excel sa všetky čísla v stĺpci „Cena“ považujú za odlišné.



Alternatívne spôsoby odstránenia duplikátov

Na prácu s duplicitnými hodnotami existujú v Exceli ďalšie nástroje. Napríklad:



Každý nástroj má svoje výhody a nevýhody. Najúčinnejšie je však na odstránenie duplikátov použiť tabuľku (ako je popísané vyššie). Tam celý proces prebieha na etapy s maximálnou kontrolou dát. To umožňuje získať vysokokvalitné výsledky.

Ahoj všetkým. Dnes vám chcem povedať, ako nájsť duplicitné hodnoty v Exceli a čo s nimi môžete robiť. Ak musíte pracovať s tabuľkou, kde sú duplicitné údaje, potom by ste radi vedeli, ako ich nájsť. To je to, čo budeme robiť v tejto lekcii.

Napríklad som si vzal tento stôl. Vzal som ľudí z nejakej skupiny vo VKontakte, oddelil som mená a priezviská a vytvoril som niekoľko buniek s duplikátmi.

Zvýraznite duplikáty v tabuľke

Prvým spôsobom vám ukážem, ako môžete nájsť duplikáty a zvýrazniť ich farbou. Možno to budete potrebovať na porovnanie akýchkoľvek údajov bez ich vymazania. V mojom príklade to budú rovnaké mená a priezviská ľudí.

Otvorí kartu „Domov“, v časti „Štýly“ vyberte „Podmienené formátovanie“ – „Pravidlá výberu buniek“ – „Duplicitné hodnoty“.

Otvorilo sa okno, v ktorom sú dve položky: čo zvýrazniť - jedinečné alebo duplicitné hodnoty a ako ich zvýrazniť - v akej farebnej schéme. A, samozrejme, tlačidlo OK.

Ak chcete hľadať v celej tabuľke, najskôr vyberte jeden alebo viac stĺpcov.

Pozrite sa na môj výsledok. Je pravda, že táto metóda má významnú nevýhodu: neexistuje žiadna vzorka, vyberá všetko, čo sa vyskytuje viac ako raz.

Selektívne zvýraznenie alebo odstránenie duplicitných hodnôt v Exceli

Metóda môže byť banálna, ale účinná. Využime funkciu „Hľadať“.

Otvorí kartu "Domov" - časť "Úpravy" - "Nájsť a vybrať" (CTRL + F).

V okne do poľa „Nájsť“ napíšeme, čo hľadáme. Potom kliknite na tlačidlo „Nájsť všetko“, stlačením klávesov CTRL + A vyberte všetky výsledky vyhľadávania a zvýraznite ich farbou. Môžete ich tiež odstrániť namiesto zvýraznenia.

Odstráňte všetky identické hodnoty v Exceli pomocou rozšíreného filtra

Ak chcete použiť rozšírený filter, vyberte ľubovoľnú bunku v tabuľke. Vybral som si ľavú hornú časť. Potom otvorte kartu "Údaje", prejdite do časti "Zoradiť a filtrovať" a kliknite na tlačidlo "Rozšírené".

Teraz musíte v tomto okne nakonfigurovať, ako sa bude filtrovanie vykonávať. Výsledky filtrovania môžete skopírovať na iné miesto (začiarknite políčko a zadajte umiestnenie, kam sa výsledok skopíruje), alebo môžete výsledok ponechať na rovnakom mieste. A samozrejme zaškrtnite „Len jedinečné hodnoty“.

Tu je môj výsledok použitia pokročilého filtra na tabuľku. Ako vidíte, v dôsledku toho program Excel dokázal nájsť a odstrániť duplikáty.

Ďalší spôsob, ako rýchlo odstrániť duplikáty v tabuľke

Táto metóda odstráni všetky identické hodnoty, ktoré sa vyskytujú v tabuľke. Ak chcete hľadať iba v niektorých stĺpcoch, vyberte ich.

Teraz otvorte kartu „Údaje“, časť „Práca s údajmi“, „Odstrániť duplikáty“.

Zaškrtnime políčka. Potrebujem dvojstĺpcové vyhľadávanie, tak to nechám tak a kliknem na tlačidlo "OK".

Toto je koniec metódy. Tu je môj výsledok jeho práce.

Vďaka za prečítanie. Nezabudnite zdieľať so svojimi priateľmi pomocou tlačidiel sociálnych médií a komentárov.