Search through PDF, TXT and HTM files .. regex

Hi,

I'm quite new to .NET, 

I have a directory with sub folders with hundreds of TXT, PDF and HTM files,  
my current task is to extract all numbers builded in this way 000000-000 (I figure out that reg ex for it will be: ^([0-9]{6}[\s\-]{1}[0-9]{3})$ ), I found few ready to use search tools, <a href="http://www.powergrep.com/index.html">one</a> of them was working just fine unfortunately it didn't index PDF files. 

My question is: are there any other search tools worth to try, or shoud I use win forms to build one myself  

Best Regards
Kooba 


Answer this question

Search through PDF, TXT and HTM files .. regex

  • Stevezilla2000

    Why don´t you use MS Indexing-Service  I found a plugin from Adobe which enables you to search even PDF-Files. TXT and HTML files are no problem for Indexing-Service itself. The plugin´s called PDF IFilter 5.0. Look at: http://download.adobe.com/pub/adobe/acrobat/win/all/ifilter50.exe 
  • Search through PDF, TXT and HTM files .. regex