E-mailadressen filteren uit PDF, Excel of Word of HTML Webpagina vereist installatie van Notepad++. Je zegt: ‘Notepad Plus Plus’, het is gratis software voor Windows 10. NB. Het is dus niet mogelijk om binnen Word dit soort email filtering commando’s  uit te voeren.

Binnen Word kun je natuurlijk wel zoeken op het teken “@” via Ctrl+H. Dan kom je alle emailadressen ook tegen. Die knip en plak je dan handmatig. Maar….. Als je vaker emailadressen moet filteren uit een brei van informatie, kun je voortaan beter uitwijken naar software die regular expressions (zie verder) ondersteunt. Het lijkt erg complex, en dat is het ook, maar de 10 stappen in dit bericht loodsen je er in 10 minuten doorheen!

Emailadressen filteren via regular expressions (Notepad++)

Als je een tekst hebt waarin emailadressen staan die je geautomatiseerd wilt filteren dan vereist dit een aantal stappen. Eerst de tekst in de Excel of de PDF of in de webpagina selecteren,knip en plak dit dan naar Notepad++. Als het om de HTML van een webpagina gaat met daarin één of meer emailadressen, dan kan kopiëren ook door eerst Ctrl+U te klikken; als je op de juiste webpagina staat (in de browser): kopiëer dan de HTML / broncode van een hele webpagina: dit is een snelle methode voor emailadressen uit een webpagina te vinden, te filteren en te selecteren, zodat je deze emailadressen daarna in Outlook kunt plakken om een mail te gaan versturen.

Resultaat: gewoon een rijtje emailadressen onder elkaar…

Linksom of rechtsom, wat je uiteindelijk wilt, is gewoon een rijtje emailadresse onder elkaar. Zodat je de bron: Excel, PDF, HTML of Word bestand kunt laten voor wat het is. En je deze emails in Outlook kan gebruiken.

email adres uit excel pdf word html regel geselecteerd via zoek en vervang notepad plus plus

Resultaat via gratis software Notepad++ waarmee je ondermeer email adressen kunt filteren

Waarom Notepad++ als gratis code editor?

Er zijn vele programma’s in omloop, maar ik zweer (ook anno 2019) nog steeds bij de code software Notepad++ dat al jaren bestaat en nog steeds updates krijgt. Mogelijk ligt deze keuze anders voor programmeurs die veel met code werken, maar voor webredactie is beheersing van Notepad++ precies goed. Binnen Notepad++ is het mogelijk om geavanceerde zoek en vervangfuncties te gebruiken, ook wel ‘regular expressions’ of ‘REGEX’ genoemd. Via selecteren, markeren, filteren en vervangen, kun je dan precies de code overhouden die je nodig hebt.

Of het nu om selecties uit programmeercode gaat of om filtering van tekst uit een Excel, PDF, Word of webpagina. Emailadressen filteren zonder deze te hoeven overtypen, kan veel tijd besparen, mits je deze taak terugkerend hebt! Na installatie van Notepad++ zal filteren van emails je zeker lukken. Ik gebruik Notepad++ ook voor simpele macro’s (standaard handelingen). Het enige nadeel van Notepad++ is wel dat je macro’s niet meer kunt aanpassen. Maar dat is ook weer goed, omdat je macro’s heel kort en eenvoudig moet houden. Het is altijd beter om complexe filtertaken in meerdere macro’s te zetten.

Als je lezer bent van dit bericht nu bijna afhaakt, dan begrijp ik dat. Welnu, het gaat nu niet om macro’s maar om het filteren  van emailadressen uit een hoop shit.

10 Stappen emailadressen filteren handleiding via Notepad++ selectie

Nu volgen de stappen als handleiding, onder de 10 stappen staan alle Notepad++ screenshots die je laten zien hoe emailadressen filteren uit programmeerregels of andere documentatie (PDF, Excel, Word, HTML document) kan lukken. Succes verzekerd! Je hebt de juiste content nu gevonden, nog even doorzetten dus! :-)

  1. Download en installeer eerst Notepad++ voor Windows 10 (gratis)
  2. Knip en plak de gehele tekst uit Excel, Word, PDF, of HTML-document inclusief de emailadressen die je eruit wilt filteren. Plak alles dus in Notepad++.
  3. Ga naar de functie “Replace”
  4. Gebruik eerst de functie “Mark”, dit is een apart tabblad binnen de functie Replace in Notepad++
  5. Find What (eerste reguliere expressie), kopieer deze filtercode:
    .*(\b[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,}\b).*
  6. Kies voor “Mark all’, druk dan “Close”
  7. Ga nu eerst naar “Search/Bookmarks”, dit is een zijstap om regels zonder emailadressen weg te gooien. Kies “verwijder/delete/ remove unmarked lines”
  8. Ga naar het menu Replace,
  9. Replace/vervang met (tweede reguliere expressie) kopieer dit commando bij Replace:
    $1
  10. Kies “Replace all”. Het resultaat is een rij emailadressen (mits emailadressen een gangbare vorm hebben en meekomen in deze selectie)

Afbeeldingen emailadressen filteren handleiding

Wat net is uitgelegd, vind je samengevat in deze screenshots van Notepad++ om emailadressen te filteren:

Code inplakken, in dit geval webpagina via Ctrl+U in de browser (knippen en plakken: Ctrl+A en dan Ctrl+C en dan Ctrl+V)

Notepad++ plak tekst in Notepad

Ingeplakte code of tekst

 

Emailadressen markeren en selecteren Notepad++

Screenshot Notepad++

 

Mark all emailadressen om te filteren

Screenshot Notepad++ – markeer regel die aan de voorwaarde voldoet

 

gefilterde emailadressen in Notepad++ als resultaat

Gefilterde emailadressen in Notepad++ als resultaat nadat alle ongemarkeerde regels zijn verwijderd, en het ‘replace all’ commando is gegeven.

Extra toelichting bij regular expression voor emailadres filteren

Het gedeelte tussen de haken omschrijft de syntaxis van een willekeurig emailadres. De toevoegingen ‘.*’ houden in: alles dat een teken of een spatie is in een oneindige reeks. In principe worden alle emailadressen geselecteerd en alle andere teksten op de regel. Maar omdat de emailadressen verzameling (de selectie code tussen de haken) herkenbaar is voor Notepad++ Regular expressions kan deze verzameling terughaald worden via het commando ‘$1’, wat betekent: haal de eerste verzameling op die tussen haken staat. Dat is nu 1 verzameling met een emailadres per regel.

Bonus reguliere expressies:

[dit volgt later nog, stel gerust je vraag aan mij, zie mijn email adres onderin deze site]

Links voor nuttige regular expressions

https://www.regular-expressions.info/examples.html

Succes met emails filteren,

Gerben G van Dijk

0 antwoorden

Plaats een Reactie

Meepraten?
Draag gerust bij!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *