如何在Java / Clojure中获取所有字母的集合？

在Python中，我可以这样做：

>>> import string >>> string.letters 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

有没有办法在Clojure中做类似的事情（除了在某处复制和粘贴上面的字符）？我查看了Clojure标准库和java标准库，但找不到它。

一个正确的非以ASCII为中心的实现：

 private static String allLetters(String charsetName) { CharsetEncoder ce = Charset.forName(charsetName).newEncoder(); StringBuilder result = new StringBuilder(); for(char c=0; c


 用“US-ASCII”调用它，你将获得所需的结果（除了大写字母首先）。 你可以用Charset.defaultCharset()调用它，但我怀疑你在大多数系统上获得的远远超过ASCII字母，即使在美国也是如此。 
 警告：只考虑基本的多语言平面。 不会太难扩展到补充平面，但这需要更长的时间，并且实用程序是值得怀疑的。



		      	 如果你只想要Ascii字符， 
 (map char (concat (range 65 91) (range 97 123))) 
 会屈服， 
 (\A \B \C \D \E \F \G \H \I \J \K \L \M \N \O \P \Q \R \S \T \U \V \W \X \Y \Z \a \b \c \d \e \f \g \h \i \j \k \l \m \n \o \p \q \r \s \t \u \v \w \x \y \z) 



		      	 基于Michaels命令式Java解决方案，这是一个惯用的（懒惰序列）Clojure解决方案： 
 (ns stackoverflow (:import (java.nio.charset Charset CharsetEncoder))) (defn all-letters [charset] (let [encoder (. (Charset/forName charset) newEncoder)] (letfn [(valid-char? [c] (and (.canEncode encoder (char c)) (Character/isLetter c))) (all-letters-lazy [c] (when (<= c (int Character/MAX_VALUE)) (if (valid-char? c) (lazy-seq (cons (char c) (all-letters-lazy (inc c)))) (recur (inc c)))))] (all-letters-lazy 0)))) 
  更新：感谢cgrand这个更好的高级解决方案： 
 (defn letters [charset-name] (let [ce (-> charset-name java.nio.charset.Charset/forName .newEncoder)] (->> (range 0 (int Character/MAX_VALUE)) (map char) (filter #(and (.canEncode ce %) (Character/isLetter %)))))) 
 但是我的第一种方法之间的性能比较 
 user> (time (doall (stackoverflow/all-letters "ascii"))) "Elapsed time: 33.333336 msecs" (\A \B \C \D \E \F \G \H \I \J \K \L \M \N \O \P \Q \R \S \T \U \V \W \X \Y \Z \\ a \b \c \d \e \f \g \h \i \j \k \l \m \n \o \p \q \r \s \t \u \v \w \x \y \z) 
 和你的解决方案 
 user> (time (doall (stackoverflow/letters "ascii"))) "Elapsed time: 666.666654 msecs" (\A \B \C \D \E \F \G \H \I \J \K \L \M \N \O \P \Q \R \S \T \U \V \W \X \Y \Z \\ a \b \c \d \e \f \g \h \i \j \k \l \m \n \o \p \q \r \s \t \u \v \w \x \y \z) 
 非常有趣。 



		      	 不，因为那只是打印出ASCII字母而不是全套。 当然，使用两个for循环打印26个小写字母和大写字母是微不足道的，但事实是在前127个代码点之外还有更多的“字母”。  Java的“isLetter”字符对于这些和其他许多人来说都是正确的。 



		      	
  string.letters：下面描述的字符串小写和大写的串联。 特定值取决于语言环境，并在调用locale.setlocale（）时更新。 

 我修改了Michael Borgwardt的答案。 在我的实现中，有两个列表lowerCases和upperCases有两个原因： 


  string.letters是小写，后跟大写。 


  Java Character.isLetter（char）不仅仅是大写和小写，因此使用Character.isLetter（char）将在一些字符集下返回很多结果，例如“windows-1252” 


 来自Api-Doc：Character.isLetter（char） ： 

 如果Character.getType（ch）提供的常规类别类型是以下任何一个字符，则该字符被视为字母： 
 * UPPERCASE_LETTER * LOWERCASE_LETTER * TITLECASE_LETTER * MODIFIER_LETTER * OTHER_LETTER 
 并非所有信件都有案例。 许多字符都是字母，但既不是大写字母，也不是小写字母，也不是标题字母。 

 因此，如果string.letters只返回小写和大写，则必须忽略TITLECASE_LETTER，MODIFIER_LETTER和OTHER_LETTER字符。 
 public static String allLetters(final Charset charset) { final CharsetEncoder encoder = charset.newEncoder(); final StringBuilder lowerCases = new StringBuilder(); final StringBuilder upperCases = new StringBuilder(); for (char c = 0; c < Character.MAX_VALUE; c++) { if (encoder.canEncode(c)) { if (Character.isUpperCase(c)) { upperCases.append(c); } else if (Character.isLowerCase(c)) { lowerCases.append(c); } } } return lowerCases.append(upperCases).toString(); } 
  另外：更改语言环境时string.letters的行为会发生变化。 这可能不适用于我的解决方案，因为更改默认语言环境不会更改默认字符集。 来自apiDoc： 

 默认字符集在虚拟机启动期间确定，通常取决于底层操作系统的区域设置和字符集。 

 我猜，默认的charset不能在启动的JVM中更改。 因此，仅使用Locale.setDefault（Locale）无法实现string.letters的“更改区域设置”行为。 但是更改默认语言环境无论如何都是一个坏主意： 

 由于更改默认语言环境可能会影响许多不同的function区域，因此只有在调用方准备重新初始化在同一Java虚拟机中运行的区域设置敏感代码时，才应使用此方法。 




		      	 我很确定这些字母在标准库中不可用，因此您可能只需要手动方法。 



		      	 如果你不记得代码点范围。 蛮力方式:-P： 
 user> (require '[clojure.contrib.str-utils2 :as stru2]) nil user> (set (stru2/replace (apply str (map char (range 0 256))) #"[^A-Za-z]" "")) #{\A \a \B \b \C \c \D \d \E \e \F \f \G \g \H \h \I \i \J \j \K \k \L \l \M \m \N \n \O \o \P \p \Q \q \R \r \S \s \T \t \U \u \V \v \W \w \X \x \Y \y \Z \z} user> 



		      	 与Python解决方案形成对比的是，必须手动生成以下语句，您的问题中提到的结果相同： 
 public class Letters { public static String asString() { StringBuffer buffer = new StringBuffer(); for (char c = 'a'; c <= 'z'; c++) buffer.append(c); for (char c = 'A'; c <= 'Z'; c++) buffer.append(c); return buffer.toString(); } public static void main(String[] args) { System.out.println(Letters.asString()); } }



  DAO方法的标准命名约定
  如何重组Maven多模块项目？
	两张地图之间的差异
用于Clojure用户的Java
Scala  –  Java =？  （或Clojure  –  Java =？）
在Android中使用动态语言开始编程（（J）Ruby，Clojure ……）
创建一个用于从Java / Clojure执行的jar文件
我是否可以在Java 8中将Clojure函数用作Lambdas？
（require）函数的clojure类路径问题？
尝试从Clojure填充Java类时，“找不到匹配的ctor”
SimpleDateFormat似乎给出了错误的结果




     

      
      
        
      




  Interesting Posts

如何在Clojure中捕获多个exception？用于匹配未被引号括起的逗号的正则表达式使用Clojure库捆绑本机JNI共享库昂贵算法的Clojure性能什么是在java中使用的好的持久性集合框架？与Leiningen一起部署Clojure应用程序与Netty和NIO高度并发的HTTPClojure Web Apps的优秀Web服务器/ Servlet容器？如何将类型化的集合从clojure传递给java？为什么这个Clojure程序这么慢？  如何让它快速运行？





        
          

            
              Back to top
              Java开发
            
            Copyright © Dovov 编程网 - All Rights Reserved.