Posts: 555
Joined: 16 Jan 2018, 13:34

Alternativen zu online Rechtschreibkorrektur

23 Jun 2023, 05:12

mit folgendem Code überprüfe ich mit der Google Rechtschreibkorrektur einen Text, den ich mit Screen OCR eingelesen habe. Quasi als letzten Schliff in der Qualitätsprüfung.

Der Code funktioniert einwandfrei. Hat jemand Ideen für eine andere, vielleicht schnellere Herangehensweise?

Code: Select all


	  global startTime := a_tickCount
          FileEncoding, UTF-8

          correction := "in münster und köln sind die strasen saubber"
         correction := "wievieele Tankstelen gibtt es in münster und köln"

	  split := strSplit(function(correction),"`n","`r")
          MsgBox % split.1 "`n`n" split.2 " mSec"

          function(correction) {
	  url := "" (EncodeDecodeURI(correction,true, false)) "&ie=UTF-8"
	  urlDownloadToFile,% url, tmp_html.html
	  fileRead, html, tmp_html.html
	  FileDelete, tmp_html.html
	  loop, parse,% html, `n, `r
	  if inStr(a_loopField,">Ergebnisse f") 
	  res := xStr(a_loopField,,"href=""/search?ie=UTF-8&q=","&spell=1")
	  res := strReplace(res,"+",a_space)
	  return 	(EncodeDecodeURI(res,false, false)) 
			? (EncodeDecodeURI(res,false, false)) "`n" (a_tickCount-StartTime)
			: correction "`n" (a_tickCount-StartTime)

xStr(ByRef H, C:=0, B:="", E:="",ByRef BO:=1, EO:="", BI:=1, EI:=1, BT:="", ET:="") {                           
Local L, LB, LE, P1, P2, Q, N:="", F:=0                 ; xStr v0.97 by SKAN on D1AL/D343 @  
Return SubStr(H,!(ErrorLevel:=!((P1:=(L:=StrLen(H))?(LB:=StrLen(B))?(F:=InStr(H,B,C&1,BO,BI))?F+(BT=N?LB

EncodeDecodeURI(str, encode := true, component := true) {  ; autor unbekannt
   static Doc, JS
   if !Doc {
      Doc := ComObjCreate("htmlfile")
      Doc.write("<meta http-equiv=""X-UA-Compatible"" content=""IE=9"">")
      JS := Doc.parentWindow
      ( Doc.documentMode < 9 && JS.execScript() )
   Return JS[ (encode ? "en" : "de") . "codeURI" . (component ? "Component" : "") ](str)
06_23_23 @11_47_15.PNG
06_23_23 @11_47_15.PNG
just me
Re: Alternativen zu online Rechtschreibkorrektur

23 Jun 2023, 07:03


was immer es bringen mag, in der Doku zu UrlDownloadToFile findest Du ein Beispiel, wie man das auch ohne den Umweg über eine Datei machen kann. maestrith hat hier: viewtopic.php?t=3291 eine eigene Version als Funktion eingestellt.

Generell ist noch anzumerken, dass Dinge wie

Code: Select all

	  return 	(EncodeDecodeURI(res,false, false)) 
				? (EncodeDecodeURI(res,false, false)) "`n" (a_tickCount-StartTime)
				: correction "`n" (a_tickCount-StartTime)
grundsätzlich vermieden werden sollten. Du rufst hier für den Fall, dass der erste Funktionsaufruf ein korrektes Ergebnis liefern würde, die Funktion ein zweites Mal auf. Mit den AHK-eigenen Möglichkeiten ist Folgendes besser:

Code: Select all

	  return 	(Result := EncodeDecodeURI(res,false, false)) 
				? Result "`n" (a_tickCount-StartTime)
				: correction "`n" (a_tickCount-StartTime)
Beides Änderungen werden aber wahrscheinlich nicht viel bringen.

Deutlich schneller sollte eine Offline-Korrektur sein. Ich kenne aber keine entsprechenden Anwendungen.
Re: Alternativen zu online Rechtschreibkorrektur

26 Jun 2023, 08:49

Hallo Just Me,

vielen Dank. Ich habe URLDownloadToVar(url) getestet, musste aber feststellen das es in meinem Fall nicht funktioniert, schon bei der ersten Abfrage bekomme ich eine Fehlermeldung.

Es läuft aber auch ohne ganz toll

06_26_23 @3_40_40.PNG
06_26_23 @3_40_40.PNG

Code: Select all

	  global startTime := a_tickCount
          FileEncoding, UTF-8
;         correction := "in münster und köln sind die strasen saubber"
         correction := "wievieele Tankstelen gibtt es in münster und köln"
;         correction := "dies ist ein fehlerfreier text, er wird im original zurück gegeben"
	  split := strSplit(function(correction),"`n","`r")
          MsgBox % (split.1) ? (split.1 "`n`n" split.2 " mSec") : ""

        function(correction) {
	url := "" (EncodeDecodeURI(correction,true, false)) "&ie=UTF-8"

	toVar := true        ; true erzeugt fehler 403
	if toVar
	html := URLDownloadToVar(url)
	  urlDownloadToFile,% url, tmp_html.html
	  FileRead, html, tmp_html.html
	  FileDelete, tmp_html.html

	  loop, parse,% html, `n, `r
          if inStr(a_loopField,">Ergebnisse f") 
          res := xStr(a_loopField,,"href=""/search?ie=UTF-8&amp;q=","&amp;spell=1")
	  res := strReplace(res,"+",a_space)
	  return 	(Result := EncodeDecodeURI(res,false, false)) 
				? Result "`n" (a_tickCount-StartTime)        ; return korriguert
				: (error#403 := FEHLER(html))
				? error#403 "`n" (a_tickCount-StartTime)     ; return error
				: correction "`n" (a_tickCount-StartTime)    ; return original

FEHLER(html) {
	  loop, parse,% html, `n, `r
          if inStr(a_loopField,"Your client does not have permission to get URL") 
          res := xStr(a_loopField,,"<title>","</title>")
	  if res contains Error 403
	  filedelete, Error#403.html
	  fileappend,% html, Error#403.html
	  try run, Error#403.html
	  return res

	return hObject.ResponseText

xStr(ByRef H, C:=0, B:="", E:="",ByRef BO:=1, EO:="", BI:=1, EI:=1, BT:="", ET:="") {                           
Local L, LB, LE, P1, P2, Q, N:="", F:=0                 ; xStr v0.97 by SKAN on D1AL/D343 @  
Return SubStr(H,!(ErrorLevel:=!((P1:=(L:=StrLen(H))?(LB:=StrLen(B))?(F:=InStr(H,B,C&1,BO,BI))?F+(BT=N?LB

EncodeDecodeURI(str, encode := true, component := true) {    ; autor unbekannt
   static Doc, JS
   if !Doc {
      Doc := ComObjCreate("htmlfile")
      Doc.write("<meta http-equiv=""X-UA-Compatible"" content=""IE=9"">")
      JS := Doc.parentWindow
      ( Doc.documentMode < 9 && JS.execScript() )
   Return JS[ (encode ? "en" : "de") . "codeURI" . (component ? "Component" : "") ](str)
Re: Alternativen zu online Rechtschreibkorrektur

24 Jul 2023, 19:26

nachtrag, so geht es auch

Code: Select all

url := ""
anow := a_now
urlDownLoadToFile,% url,% a_scriptDir "\" anow " tmp.txt.html" 
fileRead, thisHTML,% a_scriptDir "\" anow " tmp.txt.html"
fileDelete,% a_scriptDir "\" anow " tmp.txt.html"
Doc := DocumentFromHTML(thisHTML)
res := doc.getElementsByName("scl")
MsgBox,,% a_lineNumber,% clipboard := res[0].innerText  
	; super trouper von der gruppe abba eine musikgruppe der 80er 

